GESTIN DE PLIZAS DE SEGUROS: UN CASO PRCTICO DE BUSINESS INTELLIGENCE
UNIVERSIDAD CARLOS III DE MADRID
ESCUELA POLITCNICA SUPERIOR
Autor: Silvia Rodrguez Mogolln
Tutor: Agapito I. Ledezma Espino
Diciembre, 2009
Ingeniera Informtica Proyecto Fin de Carrera
II
III
Agradecimientos
En primer lugar quiero agradecer a Agapito Ledezma la ayuda que me ha
prestado para realizar este proyecto que surgi de una idea que yo le present.
Adems, gracias por sus correcciones y su disponibilidad.
Debo agradecer a mi anterior empresa, GTBC por haberme dado el conocimiento
necesario sobre Business Intelligence, que no slo me han ayudado a hacer el
proyecto fin de carrera, sino tambin a elegir mi futuro laboral. En especial quiero
agradecerle a Rute Julio todo lo que me ha enseado, haberme prestado los datos
para el caso prctico de este proyecto, guiarme con el anlisis y diseo, as como el
programa utilizado para el proceso ETL, gracias Rute.
Tambin quiero darles las gracias a mis padres por el esfuerzo que han hecho
siempre para darme todas las facilidades para desarrollar mi carrera, y todo el cario y
apoyo que me han proporcionado para conseguir que llegue este momento. De igual
forma, mis hermanos me han ayudado siempre y les agradezco el cario y apoyo que
suponen para m. Y por supuesto al resto de mi familia, tos y primos que siempre han
estado ah para apoyarme, en especial a mis abuelos que ya no estn, y dnde estn
estarn orgullos de lo que he conseguido gracias a su ayuda.
Quiero agradecer a mis compaeros, con los que he compartido muchos
momentos, bueno y malos, agobios por prcticas que no acababan, exmenes que
llegaban antes de tiempo, etc. Hemos estado muchos aos juntos y nos hemos
ayudado en todo lo que hemos podido, gracias Pili (mi gran compaera), Arturo, Fre,
Bris, Javi, Jess, Mara, Laura, Nieves, Alba, David, Diana, Laurita, y muchos ms que
me dejo en el tintero pero que tambin me acuerdo.
Y por ltimo, pero no menos importantes a mis amigas, que no han ido conmigo
a la universidad pero siempre han estado ah para apoyarme, gracias Roci, Anita, Ana
y Rosario.
IV
ndice de Contenidos
CCAAPPTTUULLOO 11 IINNTTRROODDUUCCCCIINN ...................................................................................................................................................................................... 1133
CCAAPPTTUULLOO 22 OOBBJJEETTIIVVOOSS DDEELL PPFFCC .................................................................................................................................................................... 1155
CCAAPPTTUULLOO 33 EESSTTAADDOO DDEELL AARRTTEE ............................................................................................................................................................................ 1177
3.1 Qu es Business Intelligence? ................................................................................ 18
3.2 Data Warehouse y BI ................................................................................................ 19
3.3 Elementos de Sistemas BI ........................................................................................ 26
3.4 Ciclo de Vida de Sistemas BI .................................................................................... 27
3.5 Business Intelligence Roadmap ................................................................................ 31
3.6 Herramientas de Business Intelligence ..................................................................... 72
CCAAPPTTUULLOO 44 CCAASSOO PPRRCCTTIICCOO:: GGEESSTTIINN DDEE PPLLIIZZAASS .............................................................................................................. 7799
4.1 Introduccin ............................................................................................................... 79
4.2 Aplicacin Business Intelligence Roadmap (BIR) ..................................................... 80
4.3 Paso 1: Evaluacin Caso de Negocio ....................................................................... 80
4.4 Paso 2: Evaluacin de la Infraestructura .................................................................. 82
4.5 Paso 3: Planificacin del Proyecto ............................................................................ 83
4.6 Paso 4: Definicin de Requisitos de Proyecto .......................................................... 83
4.7 Paso 5: Anlisis de Datos ......................................................................................... 84
4.8 Paso 6: Prototipo de Aplicacin ................................................................................ 88
4.9 Paso 7: Anlisis del Repositorio de Metadata .......................................................... 88
4.10 Paso 8: Diseo del DW ............................................................................................. 91
4.11 Paso 9: Diseo del proceso de Extraccin, Transformacin y Carga (ETL) .......... 103
4.12 Paso 10: Diseo del Repositorio de Metadata ........................................................ 106
4.13 Paso 11: Desarrollo del Proceso de Extraccin, Transformacin y Carga (ETL) ... 107
4.14 Paso 12: Desarrollo Aplicacin ............................................................................... 109
V
4.15 Paso 13: Minera de Datos ...................................................................................... 111
4.16 Paso 14: Desarrollo del Repositorio de Metadata .................................................. 118
4.17 Paso 15: Implementacin ........................................................................................ 118
4.18 Paso 16: Evaluacin................................................................................................ 118
4.19 Herramientas Utilizadas .......................................................................................... 119
4.20 Resultados .............................................................................................................. 119
CCAAPPTTUULLOO 55 CCOONNCCLLUUSSIIOONNEESS YY FFUUTTUURRAASS LLNNEEAASS ...................................................................................................................... 112211
BBIIBBLLIIOOGGRRAAFFAA .................................................................................................................................................................................................................................. 112233
AANNEEXXOO AA ................................................................................................................................................................................................................................................ 112255
AANNEEXXOO BB ................................................................................................................................................................................................................................................ 113333
AANNEEXXOO CC ................................................................................................................................................................................................................................................ 113399
AANNEEXXOO DD ................................................................................................................................................................................................................................................ 114433
VI
ndice de Tablas
Tabla 1. Comparacin BBDD frente a DW. ................................................................................ 19
Tabla 2. Comparacin de Requisitos Generales con Especficos de Negocio. ......................... 42
Tabla 3. Tipos de prototipos, propsitos e implicaciones. .......................................................... 48
Tabla 4. Comparacin de bases de datos frente a Data Warehouse......................................... 52
Tabla 5. Comparacin Anlisis Estadstico y Minera de Datos. ................................................ 63
Tabla 6. Descripcin de Tablas del Sistema Operacional. ......................................................... 85
Tabla 7. Descripcin de los Conceptos de Negocio. .................................................................. 90
Tabla 8. Descripcin de las tablas de la BBDD Origen, Staging Area. ...................................... 92
Tabla 9. Ejes de Anlisis de indicadores frente a dimensiones, para calcular el nmero de
tablas de hechos.. ....................................................................................................................... 93
Tabla 10. Tabla de descripcin de las Dimensiones del DW y sus Tipos. ................................. 96
Tabla 11. Tabla de descripcin y de los Hechos del DW y sus Tipos. ....................................... 97
Tabla 12. Tabla de Pruebas sobre el desarrollo ETL. .............................................................. 109
Tabla 13. Lista de atributos para el anlisis de Data Mining. ................................................... 111
Tabla 14. Distribucin de los conjuntos de datos para el anlisis de Data Mining, Weka. ...... 112
Tabla 15. Resultados de clasificacin con algoritmos de Data