repositorio universidad de guayaquil: página de inicio - ing....
TRANSCRIPT
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN NETWORKING & TELECOMUNICACIONES
TEMA:
DISEÑO E IMPLEMENTACIÓN DE UN PORTAL WEB PARA EL CONSEJO
NACIONAL ELECTORAL CON EL FIN DE AYUDAR EN LA CAPACITACIÓN A
LOS CIUDADANOS DEL ECUADOR ACERCA DEL CÓDIGO DE LA
DEMOCRACIA, ENFOCADO EN LA INTELIGENCIA DE NEGOCIOS
PROYECTO DE TITULACIÓN
Previa a la obtención de Título
INGENIERO EN NETWORKING Y TELECOMUNICACIONES
AUTOR:
Vicente Abel Granja Cevallos
TUTOR:
Ing. Viviana Pinos Medrano M.Sc.
GUAYAQUIL - ECUADOR
2016
I
REPOSITORIO NACIONAL EN CIENCIAS Y TECNOLOGÍA
FICHA DE REGISTRO DE TESIS
Título: “ELABORACIÓN DE BUSINESS INTELLIGENCE CON LA
IMPLEMENTACION DE LA HERRAMIENTA OPEN SOURCE PENTAHO
COMMUNITY EDITION (CE).
EN LA ELABORACIÓN DE UN DATA MART PARA OBTENER CUBOS
MULTIDIMENSIONALES Y GENERAR VISTAS DE ANÁLISIS PARA VERIFICAR LA
ACEPTACIÒN E INTERÉS DE USUARIOS PARA CAPACITACIONES POR
INTERNET"
REVISORES:
INSTITUCIÓN:
Universidad de
Guayaquil
FACULTAD: Ciencias Matemáticas y Físicas
CARRERA: "Ingeniería en Networking Y Telecomunicaciones"
FECHA DE
PUBLICACIÓN: Nº DE PÁGINAS: 91
ÁREA DE TEMÁTICA: Base de Datos
PALABRAS CLAVE: Cubo multidimensional, Spoon, ETL, OLAP, Data Mart
RESUMEN: RESUMEN
Hoy en día las Organizaciones tanto públicas o privadas para poder realizar una
correcta toma de decisiones implementan la inteligencia de negocios y para eso
utilizan herramientas informáticas que posibilitan la transformación de los datos
obtenidos de las transacciones que se producen a diario en información breve,
comprensible y segura, permitiéndoles elaborar un análisis real sobre un área de
negocio especifico. La finalidad de este trabajo de investigación y aplicación es diseñar
un Data Mart de donde se adquirirá la información necesaria que servirá para la
construcción de los cubos multidimensionales y de esta manera lograr las consultas
requeridas mediante el empleo de un visualizador OLAP que será usado por las
II
autoridades del Consejo Nacional Electoral para que puedan conseguir en todo
momento diferentes reportes estadísticos de manera rápida, haciendo posible una
adecuada toma de decisiones estratégicas sobre el progreso de la capacitación de los
ciudadanos del Ecuador acerca del código de la democracia mediante la provisión de
un portal web. El desarrollo de este proyecto evitará la realización de consultas de
manera manual, también descartar el uso de reportes en Excel y la diminución de
tiempo en la obtención de información.
Nº DE REGISTRO
(en base de
datos) Nº DE CLASIFICACIÓN:
N:
DIRECCIÓN (tesis en la web):
ADJUNTO PDF: ✓ SI NO
CONTACTO CON
AUTOR:
TELÉFONO:
E-mail:
CONTACTO DE
LA INSTITUCIÓN
NOMBRE: Carrera Ingeniería en Sistemas Computacionales
TELÈFONO: (04) 2-307729
III
CARTA DE APROBACIÓN DEL TUTOR
En mi calidad de Tutor del trabajo de investigación, "ELABORACIÓN DE
BUSINESS INTELLIGENCE CON LA IMPLEMENTACION DE LA
HERRAMIENTA OPEN SOURCE PENTAHO COMMUNITY EDITION (CE).
EN LA ELABORACIÓN DE UN DATA MART PARA OBTENER CUBOS
MULTIDIMENSIONALES Y GENERAR VISTAS DE ANALISIS PARA
VERIFICAR LA ACEPTACIÓN E INTERÉS DE USUARIOS PARA
CAPACITACIONES POR INTERNET“ elaborado por el Sr. Vicente Abel Granja
Cevallos Alumno no titulado de la Carrera de Ingeniería en Networking y
Telecomunicaciones de la Facultad de Ciencias Matemáticas y Físicas de la
Universidad de Guayaquil, previo a la obtención del Título de Ingeniero en
Networking y Telecomunicaciones, me permito declarar que luego de haber
orientado, estudiado y revisado, la Apruebo en todas sus partes.
Ing. Viviana Pinos Medrano M.Sc.
Tutor
IV
DEDICATORIA
En primer lugar mi
mama, papa y mis
hermanos que en lo
personal me ha
ayudado en todo para
llegar a ser un
profesional, a Dios por
haberme dado la
oportunidad de vivir de
poder estudiar.
Qué más puedo decir gracias
VICENTE ABEL GRANJA CEVALLOS
V
AGRADECIMIENTO.
Agradezco de todo corazón a
todos mis familiares que me
ayudaron, a mis amigos y
compañeros de la Universidad,
a mis profesores por haberme
dados los conocimientos, a la
Facultad de Ciencias
Matemáticas y Físicas por
admitirme en este centro de
estudios .
VICENTE ABEL GRANJA CEVALLOS
VI
TRIBUNAL PROYECTO DE TITULACIÓN
__________________________________ ___________________________
Ing. Eduardo Santos Baquerizo MS.c. Ing. Harry Luna Aveiga,Msc.
DECANO DE LA FACULTAD DIRECTOR CINT
CIENCIAS MATEMÁTICAS Y FÍSICAS
__________________________________ _________________________
Lsi. Oscar Apolinario Arzube M.Sc. Lcdo. Roberto Zurita Del Pozo M.Sc.
PROFESOR REVISOR DEL ÁREA – PROFESOR REVISOR DEL ÁREA
TRIBUNAL TRIBUNAL
_______________________________________
Ing. Viviana Pinos Medrano M.Sc.
PROFESOR DIRECTOR DEL PROYECTO
DE TITULACIÓN
______________________________________
Ab. Juan Chávez A.
SECRETARIO
VII
DECLARACIÓN EXPRESA
“La responsabilidad del contenido de este
Proyecto de Titulación, me corresponden
exclusivamente; y el patrimonio intelectual
de la misma a la UNIVERSIDAD DE
GUAYAQUIL”
VICENTE ABEL GRANJA CEVALLOS
CI: 0925145120
VIII
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN NETWORKING Y TELECOMUNICACIONES
DISEÑO E IMPLEMENTACIÒN DE UN PORTAL WEB PARA EL CONSEJO
NACIONAL ELECTORAL CON EL FIN DE AYUDAR EN LA CAPACITACIÒN A
LOS CIUDADANOS DEL ECUADOR ACERCA DEL CÒDIGO DE LA
DEMOCRACIA, ENFOCADO A LA INTELIGENCIA DE NEGOCIOS.
Proyecto de Titulación que se presenta como requisito para optar por el título de
INGENIERO EN NETWORKING Y TELECOMUNICACIONES
Autor/a: VICENTE ABEL GRANJA CEVALLOS
C.I. 0925145120
Tutor: Ing. Viviana Pinos Medrano
M.Sc.
Guayaquil, Noviembre de 2016
CERTIFICADO DE ACEPTACIÓN DEL TUTOR
IX
En mi calidad de Tutor del proyecto de titulación, nombrado por el Consejo
Directivo de la Facultad de Ciencias Matemáticas y Físicas de la Universidad de
Guayaquil.
CERTIFICO:
Que he analizado el Proyecto de Titulación presentado por el
estudiante VICENTE ABEL GRANJA CEVALLOS, como requisito previo para
optar por el título de Ingeniero en Networking y Telecomunicaciones cuyo tema
es:
DISEÑO E IMPLEMENTACIÓN DE UN PORTAL WEB PARA EL CONSEJO
NACIONAL ELECTORAL CON EL FIN DE AYUDAR EN LA CAPACITACIÓN
A LOS CIUDADANOS DEL ECUADOR ACERCA DEL CÓDIGO DE LA
DEMOCRACIA, ENFOCADO EN LA INTELIGENCIA DE NEGOCIOS.
Considero aprobado el trabajo en su totalidad.
Presentado por:
Vicente Abel Granja Cevallos Cédula de ciudadanía N0925145120
Tutor: Ing. Viviana Pinos Medrano M.Sc.
Guayaquil, Noviembre de 2016
X
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN NETWORKING Y TELECOMUNICACIONES
Autorización para Publicación de Proyecto de Titulación en Formato Digital
1. Identificación del Proyecto de Titulación
Nombre de Alumno: Vicente Abel Granja Cevallos
Dirección: Durán, Ciudadela Primavera 2, Sector 2A, Mz 4, Villa 6
Teléfono: 0994717986 – 2804470 E-mail: [email protected]
Facultad: Ciencias Matemáticas y Físicas
Carrera: Ingeniería en Networking y Telecomunicaciones.
Título al que opta: Ingeniero en Networking y Telecomunicaciones.
Profesor guía: Ing. Viviana Pinos Medrano M.Sc
Tema del Proyecto de Titulación:
DISEÑO E IMPLEMENTACIÓN DE UN PORTAL WEB PARA EL CONSEJO NACIONAL
ELECTORAL CON EL FIN DE AYUDAR EN LA CAPACITACIÓN A LOS CIUDADANOS DEL
ECUADOR ACERCA DEL CÓDIGO DE LA DEMOCRACIA, ENFOCADO EN LA INTELIGENCIA
DE NEGOCIOS
Tema del Proyecto de Titulación (Palabras clave):
Cubo multidimensional, Spoon, ETL, OLAP, Data Mart
XI
2. Autorización de Publicación de Versión Electrónica del Proyecto de
Titulación
A través de este medio autorizo a la Biblioteca de la Universidad de Guayaquil y a
la Facultad de Ciencias Matemáticas y Físicas a publicar la versión electrónica de
este Proyecto de titulación.
Publicación electrónica:
Inmediata Después de un año
Firma Alumno: ______________________________
3. Forma de envío:
El texto del proyecto de titulación debe ser enviado en formato Word, como archivo
.Doc. O .RTF y .Puf para PC. Las imágenes que la acompañen pueden ser: .gif,
.jpg o .TIFF.
DVDROM CDROM
XII
ÍNDICE GENERAL
CARTA DE APROBACIÓN DEL TUTOR…………….……………………………..III
DEDICATORIA…………………………………………..………………………….…IV
AGRADECIMIENTO…………………………………..……………………………….V
TRIBUNAL PROYECTO DE TITULACIÓN………...………………………………VI
DECLARACIÓN EXPRESA…………………………..……………………………..VII
AUTORÍA………………………………………………..……………………….……VIII
CERTIFICADO DE ACEPTACIÓN DEL TUTOR….………….…………….……..IX
AUTORIZACIÓN PARA PUBLICACIÓN…………..……………………….………..X
ÍNDICE GENERAL…………………..……………………………………….……….XII
ÍNDICE DE FIGURAS………..……..………………………………………..………XV
ÍNDICE DE CUADROS………..…………………………………………...……..…XVI
ÍNDICE DE TABLAS…………..…………………………………………..………..XVII
ÍNDICE DE GRÁFICOS……………………….……….…………………………..XVIII
ÍNDICE DE IMÁGENES………………………………….……...……….…………XIX
ABREVIATURAS………………………………………….………………………....XXI
SIMBOLOGÍA…………………………………………………………….………....XXII
RESUMEN………………………………………………………………….………XXIII
ABSTRACT……………………………………………………………….……..…XXIV
INTRODUCCIÓN…………………………………………………………………....…1
CAPÍTULO I……………………………………………………………………….……5
EL PROBLEMA………………………………………………………………….….….5
PLANTEAMIENTO DEL PROBLEMA……………………………………………...5
Ubicación del problema en un contexto……………………………………………..5
Situación conflicto. Nudos críticos………………………………………………..….5
Causas y consecuencias del problema…………………………………………......6
Delimitación del problema…………………………………………………………….7
Formulación del problema………………………………………………………….…7
Evaluación del problema……………………………………………………………...7
Alcances del problema………………………………………………………………..9
OBJETIVOS DE LA INVESTIGACIÓN……………………………………………12
JUSTIFICACIÓN E IMPORTANCIA DE LA INVESTIGACIÓN………………...12
CAPÍTULO II………………………………………………………………………….15
XIII
MARCO TEÓRICO………………………………………………………………….15
Antecedentes……………………………………………………………………….15
Fundamentación Teórica…………………………………………………………15
Desarrollo del proyecto de Inteligencia de Negocios………………...…………17
Beneficios de la implantación del BI………………………………………………18
Fases del proceso de Inteligencia de Negocios…………………………………19
Diferencias entre Data Warehousing y el Data Warehouse …………….....….20
Arquitectura del Data Warehousing………..…………………………………….20
Proceso de ETL (extracción transporte y carga)……………………..………….22
Tabla de dimensiones……………………………………………………….……..23
Tabla de hechos…………………………………………………………………….23
Tipos de modelamiento de un Data Warehouse……………….………………..24
Esquema en estrella……………………………………………………………….24
Cubo Multidimensional……………………………………………………………..25
Herramientas para visualizar los cubos multidimensionales………...…………26
¿Qué es Pentaho Bussines Intelligence?.........................................................27
Pentaho Data Integration (PDI)…………………………….…………………….28
Pentaho Schema WorkBench (PSW)…………………….…….…………….....28
Pentaho Report Designer (PRD)……………………………….………………..28
Fundamentación Social…………………………………………….……………….29
Fundamentación Legal……………………………………………….……………..30
Idea a defender………………………………………………….…………………...32
Definiciones Conceptuales…………………………………….……………………33
CAPÍTULO III…………………………………………………….…………………..35
METODOLOGÍA………………………………………………….………………….35
DISEÑO DE LA INVESTIGACIÓN……………………………….……………......35
Modalidad de la investigación …………………………………………………...35
Tipo de investigación …………………………………………………….………….36
Población y muestra………………………………………………………………….36
Instrumentos de recolección de datos……………………………………………...37
Recolección de la información……………………………………………………....38
Procesamiento y Análisis de la encuesta……………………………….....………39
Validación de la idea a defender .…………………………………………………..49
XIV
CAPÍTULO IV....................................................................................................50
PROPUESTA TECNOLÓGICA.........................................................................50
Análisis de la factibilidad………………………………………..………………..50
-Factibilidad Económica……………………………………….…………………….80
-Factibilidad Técnica…………………………………………………….………..….80
-Factibilidad Operativa…………………………………………………….………... 82
-Factibilidad Legal………………………………………..………………….………..82
Etapas de la Metodología del Proyecto………………………………………….83
Entregables del Proyecto……………………………………..……………………...86
Criterios de Validación de la Propuesta……………………………………..………86
Criterios de Aceptación del Producto………………………………………….……88
Conclusiones y Recomendaciones………………………………….…………...90
XV
ÍNDICE DE FIGURAS
Figura N°1 Fases del proceso de Inteligencia de Negocios…………..……19
Figura N° 2 Arquitectura del Data Warehousing…………………………………20
Figura N°3 Tabla de dimensiones…………………………………….…………..23
Figura N°4 Tabla de hechos……………………………………………………….24
Figura N°5 Esquema en estrella…………………………………………………..25
Figura N°6 Cubo Multidimensional………………………………………………..26
Figura N°7 Proceso de Scrum…………………………………………………….84
XVI
ÍNDICE DE CUADROS
Cuadro N°1 Presupuesto Estimado……………………………………………....79
Cuadro N°2 Las iteraciones del Proyecto como Cronograma……………..…..84
Cuadro N°3 Pruebas Realizadas al proyecto…………………………….……....86
Cuadro N°4 Validaciones hechas al proceso …………………………………....87
XVII
ÍNDICE DE TABLAS
Tabla N°1
Conocimiento sobre Inteligencia de negocios……………………………………39
Tabla N°2
Conocimiento sobre herramientas de Inteligencia de negocios……………….40
Gráfico N°3
Conocimientos de plataformas de inteligencia de negocios………..……….…41
Tabla N°4
Opciones para implementar inteligencia de negocios………………………..…42
Tabla N°5
Razones para no implementar inteligencia de negocios……………………….43
Tabla N°6
Empresas que brinden solución sobre inteligencia de negocios……………....44
Tabla N°7
Aplicación de inteligencia de negocios…………………………………………...45
Tabla N°8
Áreas para implementar inteligencia de negocios……………………………....46
Tabla N°9
Tiempo para generar reportes gerenciales………………………………………47
Tabla N°10
Inversión para implementar inteligencia de negocios…………………………...48
XVIII
ÍNDICE DE GRÁFICOS
Gráfico N°1
Conocimiento sobre Inteligencia de negocios……………………………………39
Gráfico N°2
Conocimiento sobre herramientas de Inteligencia de negocios……………….40
Gráfico N°3
Conocimientos de plataformas de inteligencia de negocios………..……….…41
Gráfico N°4
Opciones para implementar inteligencia de negocios………………………..…42
Gráfico N°5
Razones para no implementar inteligencia de negocios……………………….43
Gráfico N°6
Empresas que brinden solución sobre inteligencia de negocios……………....44
Gráfico N°7
Aplicación de inteligencia de negocios…………………………………………...45
Gráfico N°8
Áreas para implementar inteligencia de negocios……………………………....46
Gráfico N°9
Tiempo para generar reportes gerenciales………………………………………47
Gráfico N°10
Inversión para implementar inteligencia de negocios…………………………...48
XIX
ÍNDICE DE IMÁGENES
Imagen N° 1 Mostrar modelo de base de datos transaccional…………………51
Imagen N° 2 Mostrar modelo de base de datos transaccional…………………52
Imagen N° 3 Creación de un Job…………………………………………………..53
Imagen N° 4 Elementos que conforman un Job …………………………………54
Imagen N° 5 Secuencia del Job ya construido…………………..……………….54
Imagen N° 6 Ejemplo de configuración de una entrada del Job ……………….55
Imagen N° 7 Conexión de base de datos para trabajar con el Job……………..56
Imagen N° 8 Creación de los ETL…………………………………………………57
Imagen N° 9 Ejemplo de configuración de una entrada del ETL…………..…..57
Imagen N° 10 Configuración de una tabla de salida………………….…………58
Imagen N° 11 Creación de las tablas dimensional a partir de los ETL………..59
Imagen N° 12 Creación de las tablas hechos a partir de los ETL……………..59
Imagen N° 13 Partes del Data Mart con las tablas hechos y dimensionales…..60
Imagen N° 14 Partes del Data Mart con las tablas hechos y dimensionales….60
Imagen N° 15 Partes del Data Mart con las tablas hechos y dimensionales….61
Imagen N° 16 Partes del Data Mart con las tablas hechos y dimensionales….61
Imagen N° 17 Uso de Schema Workbench para cubos multidimensionales…62
Imagen N° 18 Conexión a la base de datos para Schema Workbench………..63
Imagen N° 19 Ejemplo de esquema de un cubo………………………………….63
Imagen N° 20 Creación y configuración del esquema del cubo………………..64
Imagen N° 21 Establecer la tabla de hechos……………………………………..64
Imagen N° 22 Crear las dimensiones del cubo.………………………………….65
Imagen N° 23 Crear las jerarquías del cubo………………………………………66
Imagen N° 24 Crear los niveles del cubo…………………………………………67
Imagen N° 25 Configurar la Usage Dimension…………………………………..68
Imagen N° 26 Crear y configurar la medida de análisis…………………………69
Imagen N° 27 Publicar el cubo……………………………………………………..70
Imagen N° 28 Mensaje de cubo publicado……………………………………….70
Imagen N° 29 Alojamiento del servidor de Pentaho BI…………………………..71
Imagen N° 30 Activar servicios del servidor de Pentaho BI…………………….72
Imagen N° 31 Crear la vista de análisis a partir del cubo multidimensional…..73
XX
Imagen N° 32 Buscar herramienta de análisis Saiku Analitics………………….74
Imagen N° 33 Crear nuevo análisis……………………………………………….75
Imagen N° 34 Verificar en la lista el cubo publicado para su análisis………….76
Imagen N° 35 Mostrar tabla dinámica del cubo………………………………….77
Imagen N° 36 Imagen dinámica en barra del cubo con porcentajes…………..78
Imagen N° 37 Imagen dinámica en pastel del cubo con porcentajes………….78
XXI
ABREVIATURAS
CNE Consejo Nacional Electoral
ETL Extracción, Transporte y Carga
XML Lenguaje de marcado extensible
OLAP Proceso analítico en línea
BI Inteligencia de negocios
XXII
SIMBOLOGÍA
N Población
n Muestra
M.sc Master
XXIII
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN NETWORKING Y
TELECOMUNICACIONES
DISEÑO E IMPLEMENTACIÓN DE UN PORTAL WEB PARA EL CONSEJO
NACIONAL ELECTORAL CON EL FIN DE AYUDAR EN LA CAPACITACIÓN
A LOS CIUDADANOS DEL ECUADOR ACERCA DEL CÓDIGO DE LA
DEMOCRACIA, ENFOCADO EN LA INTELIGENCIA DE NEGOCIOS
Autor: Vicente Abel Granja Cevallos
Tutor Ing. Viviana Pinos Medrano M.Sc.
RESUMEN
Hoy en día las Organizaciones tanto públicas o privadas para poder realizar una
correcta toma de decisiones implementan la inteligencia de negocios y para eso
utilizan herramientas informáticas que posibilitan la transformación de los datos
obtenidos de las transacciones que se producen a diario en información breve,
comprensible y segura, permitiéndoles elaborar un análisis real sobre un área de
negocio especifico. La finalidad de este trabajo de investigación y aplicación es
diseñar un Data Mart de donde se adquirirá la información necesaria que servirá
para la construcción de los cubos multidimensionales y de esta manera lograr las
consultas requeridas mediante el empleo de un visualizador OLAP que será usado
por las autoridades del Consejo Nacional Electoral para que puedan conseguir en
todo momento diferentes reportes estadísticos de manera rápida, haciendo
posible una adecuada toma de decisiones estratégicas sobre el progreso de la
capacitación de los ciudadanos del Ecuador acerca del código de la democracia
mediante la provisión de un portal web. El desarrollo de este proyecto evitará la
realización de consultas de manera manual, también descartará el uso de reportes
en Excel y disminuirá el tiempo en la obtención de información.
PALABRAS CLAVE: Cubo multidimensional, Spoon, ETL, OLAP, Data Mart
XXIV
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS MATEMÁTICAS Y FÍSICAS
CARRERA DE INGENIERÍA EN NETWORKING Y
TELECOMUNICACIONES
DESIGN AND IMPLEMENTATION OF A WEB PORTAL
FOR NATIONAL ELECTORAL COUNCIL IN ORDER TO
HELP TO TRAININGCITIZENS ABOUT ECUADOR
CODE OF FOCUSED ON INTELLIGENCE
OF BUSINESS
Autor: Vicente Abel Granja Cevallos
Tutor Ing. Viviana Pinos MedranoM.Sc.
SUMMARY
Today, both public and private organizations, in order to be able to make a correct
decision, then implement business intelligence for which they use computer tools
that enable the transformation of the data obtained from transactions that occur
daily in brief, understandable information and Secure, this allows them to elaborate
a real analysis on a specific business area. The purpose of this research and
application work is to design a Data Mart from which will acquire the necessary
information that will serve for the construction of multidimensional cubes and thus
achieve the required queries through the use of an OLAP viewer that will be used
by the authorities Of the National Electoral Council so that they can obtain different
statistical reports at any time, making it possible an adequate strategic decision
making on the progress of the training of citizens of Ecuador on the code of
democracy through the provision of a web portal . The development of this project
will avoid the execution of queries manually, also discard the use of reports in Excel
will reduce the time for obtaining information.
KEY WORDS: Multidimensional Cube, Spoon, ETL, OLAP, Data Mart
1
INTRODUCCIÓN
El portal web cuyo propósito es la capacitación de los ciudadanos ecuatorianos
sobre el código de la democracia genera muchos registros de los usuarios que se
inscriben diariamente para su capacitación online. Esta información debe ser
aprovechada por los miembros del equipo desarrollador del sistema ABC de la
Democracia para realizar un análisis del proceso de capacitación y para esto se
utiliza la inteligencia de negocios (Bussines Intelligence) que sirve para una
correcta toma de decisiones.
En la actualidad las organizaciones tanto públicas como privadas invierten cada
vez más en infraestructura informática por su constante crecimiento, así como
también el volumen de la información que se almacena diariamente y que no
puede ser examinada por los métodos tradicionales que hoy se usan, mientras
mayor sea la capacidad de almacenar muchos datos también es mayor la
incapacidad de extraer la información que sea útil, que al final queda dispersa y
oculta.
Los tradicionales sistemas que se utilizan para manejar la información no permiten
realizar un correcto análisis de la misma por algunos problemas que suceden
como pérdida de tiempo al generar consultas, datos erróneos o también la falta
de herramientas para transformar los datos en información valiosa. Actualmente
han aparecido abundantes herramientas tecnológicas que ayudan a los usuarios
a manejar grandes volúmenes de información para producir reportes de manera
ágil y precisa.
Hoy en día las instituciones públicas como es el Consejo Nacional Electoral están
orientados en el manejo de tomas de decisiones para tener conocimiento desde
dónde y cómo se organiza la información en este caso desde el portal web para
la capacitación del código de la democracia. Para esto han surgido en contexto
muchos términos que serán de análisis para la realización proyecto y en este caso
saber que es un Data Mart.
2
Se define como Data Mart a una base de datos centralizada que permite
almacenar la información de un área de negocio especifico, una característica
importante es facultar la disposición de una estructura óptima de datos para
realizar un análisis detallado de la información obtenida. Una de las funciones del
Data Mart es proporcionar la eliminación de datos erróneos que no permiten un
correcto manejo y gestión de la información.
El objetivo para justificar el uso de inteligencia de negocios es permitir a los
miembros del equipo desarrollador del sistema ABC de la Democracia medir el
uso y aceptación de los ciudadanos sobre el portal web de capacitación y proceder
a la toma de decisiones estratégicas sobre este proceso, en donde se utilizarán
las herramientas necesarias para extraer los datos almacenados de una base de
datos transaccional que en este caso pertenece al portal web donde se almacenan
los datos de los ciudadanos que se registran a otro repositorio que en este caso
será una base de datos centralizada o Data Mart que permitirá la llegada de
información óptima y resumida para poder realizar un análisis detallado por medio
de reportes estadísticos que contienen diferentes tipos de filtros como por ejemplo
localidad, género, sector de residencia, etc. y que al final muestran de qué forma
se desempeñan los usuarios al capacitarse.
Un Data Mart se construye según las necesidades de los usuarios que en este
caso serán las autoridades del Consejo Nacional Electoral acerca de la
información que requieran consultar para su respectivo estudio, una vez creado
se procede a diseñar los cubos multidimensionales para obtener las distintas
vistas de análisis necesarias que permitirán realizar una correcta toma de
decisiones estratégicas acerca del proceso de capacitación online y así alcanzar
los objetivos propuestos en este proceso.
Con el uso de la Inteligencia de Negocios una organización puede analizar la
eficiencia de cualquier departamento o área que desee, tomando como ejemplo
medir la capacidad del recurso humano, el estado de las finanzas o que servicios
son rentables y si se encuentra alguna falla se procede a tomar una correcta
decisión para corregirla.
Los diferentes tipos de software que están disponibles en el mercado para
implementar la inteligencia de negocios sean estos open source o comercial
3
siempre están en constante desarrollo para dar un mejor servicio a las
organizaciones que desean usarla y así realicen una correcta toma de decisiones
estratégicas sobre un área específica de negocio. Una característica destacable
del software para Inteligencia de negocios es que puede adaptarse de forma
segura en la plataforma tecnológica que tenga la organización que desean usarla
como por ejemplo si los servidores emplean un Sistema operativo Open Source
como Linux o de licencia comercial como Windows Server 2012, haciendo posible
el ahorro de recursos tecnológicos.
Esta tesis está organizada de la siguiente manera:
En el Capítulo 1 se expone cual es el tema de investigación, en donde también se
realiza el planteamiento del problema, cuáles son las causas y consecuencias del
problema propuesto, la delimitación del problema, la formulación del problema, la
evaluación del problema así como la justificación, los alcances del problema,
también los objetivos generales y específicos del proyecto.
En el capítulo 2 expone el marco teórico, la idea a defender, los antecedentes para
realizar este proyecto, la fundamentación teórica que está relacionado con el tema
de investigación dando soporte al desarrollo del mismo, también se define cual
es el soporte legal como social, también se desarrolla la idea a defender y la
definiciones conceptuales.
En el capítulo 3 se expone la metodología usada para el desarrollo del tema,
también la modalidad de investigación, el método de investigación, búsqueda de
la información y la descripción de la propuesta. Temas a detallarse en este capítulo
es determinar la población, la muestra, cómo se recolecto la información, número
de personas que son parte de este proyecto y también el estudio de los diferentes
procedimientos o métodos de los datos que se han obtenido, la validación de la
idea a defender
En el capítulo 4 se expone como se desarrolla el proyecto paso a paso para
alcanzar los objetivos propuestos en la tesis llamado también la propuesta
tecnológica. También se define el costo para realizar el proyecto, cuales son los
recursos tecnológicos a usarse, la factibilidad legal, económica, operacional, que
metodología se usó para realizar el proyecto, el entregable del proyecto que puede
ser por ejemplo un manual de usuario, hardware, también se expone las
4
conclusiones y las recomendaciones del trabajo y las referencias bibliográficas
utilizadas para el desarrollo de la tesis y sus respectivos anexos en la que
mostramos por ejemplo la instalación paso a paso del software o hardware a
usarse en la tesis, también se establecen cuáles son los criterios de validación de
la propuesta, los criterios de aceptación del Producto.
5
CAPÍTULO I
EL PROBLEMA
PLANTEAMIENTO DEL PROBLEMA
Ubicación del Problema en un Contexto
Para poder capacitar a los ciudadanos sobre el código de la democracia se ha
implementado un portal web que proveerá este conocimiento hecho en las
instalaciones del Consejo Nacional Electoral entre los meses de marzo y junio de
este año, y cuyo objetivo de esta instrucción es medir los conocimiento de los
ciudadanos por medio de un test de conocimientos sobre lo que aprendió. En la
actualidad el Consejo Nacional Electoral no cuenta con un software open source
para poder realizar inteligencia de negocios y por ende necesita la implementación
de este tipo de herramientas para satisfacer esta necesidad, por este motivo se
procedió a escoger la suite de programas que conforman la plataforma de Pentaho
BI Community Edition, en donde se utilizará la información generada en el portal
web y por medio de un ETL(Extracción, Transporte y Carga) será transferida a un
Data Mart que permitirá la creación de cubos multidimensionales que luego serán
cargadas en un servidor para inteligencia de negocios propia de la plataforma a
usarse, en donde se diseñarán las distintas vistas de análisis necesarios que serán
utilizadas por los miembros del equipo desarrollador del sistema ABC de la
Democracia y de esta manera puedan realizar la toma de decisiones estratégicas
sobre la capacitación de los ciudadanos.
Situación Conflicto. Nudos Críticos
Debido a que las organizaciones utilizan herramientas convencionales sean de
manera manual o por medio de aplicaciones informáticas para la obtención de
datos provoca una demora de tiempo que dificulta el análisis de los mismos a la
hora de realizar la toma de decisiones estratégicas, es por este motivo que la
implementación de un software de inteligencia de negocios permitiría la
6
automatización y agilización de los procesos para la obtención de datos que
permitirían tener información confiable para una correcta toma de decisiones.
Cada vez que se generan nuevos registros provenientes del portal web son
almacenados en una base de datos transaccional y debido a que son muchos los
ciudadanos que se inscriben para su capacitación producen una gran cantidad de
información que hace muy difícil la migración a otra base de datos para su análisis
respectivo por métodos tradicionales provocando inconsistencias y demora de
tiempo, es por este motivo que el uso de un software para inteligencia de negocios
solucionaría estos inconvenientes permitiendo la migración de la información en
menor tiempo y haciendo a su vez más confiable a la hora de realizar los análisis
necesarios por medio de reportes estadísticos que permitirían tener una visión
clara del uso y aceptación de los ciudadanos que instruyen en el portal web.
Causas y Consecuencias del Problema
CAUSAS CONSECUENCIAS
Actualmente el proceso para la
generación de diferentes tipos de
reportes es realizado de manera
tradicional por medio del uso de código
SQL.
Si se requiere consultar una
información al momento no se podrá
realizar porque el proceso es
demasiado lento al realizarlo.
La migración de la información de una
base de datos a otra es muy compleja
con las actuales aplicaciones que tiene
el Consejo Nacional Electoral.
Si se desea extraer una parte de la
información de la base de datos
principal a un repositorio para
proceder a realizar un análisis
requerido el proceso es muy tedioso.
No existe un servidor web que permita
la generación de consultas dinámicas
y también para la manipulación de la
información de manera remota.
Si un usuario desee realizar una
consulta desde su oficina no lo podrá
realizar ya que no cuenta con un
sistema que le permita realizar esas
tareas
7
Delimitación del Problema
Actualmente las organizaciones tanto públicas como privadas están propensos a
tomar decisiones sin tener una información acorde porque que no cuentan con las
herramientas tecnológicas para una correcta toma de decisiones y terminarán en
consecuencias que generarán alarmas y componentes nefastos, por aquellos
motivos negativos las organizaciones llegan a implementar un software para
inteligencia de negocios que servirá de utilidad para mejorar las perspectivas de
su organización.
Para poder evitar estos de estos percances actualmente se está contando con la
plataforma de Pentaho BI que es Open Source que permite solventar los costos
en tecnología, ya que está siendo empleada en muchos proyectos que necesiten
usar la inteligencia de negocios, cuya característica especifica es tener siempre
a mano su código fuente para poder darle el uso que se requiera dependiendo de
las necesidades de la organización y así inducir nuevos patrones de negocios.
En lo que se respecta a la problemática se planteará un avance de los modelos
de inteligencia de negocios basado siempre en software Open Source. En pie a lo
antepuesto este modelo se concentrará en el estudio y proceso de las
herramientas open source y que apunta a las organizaciones ya sean estas
públicas o privadas que tienen la necesidad de implementar inteligencia de
negocios y que por falta de asesoría pertinente no pueden elegir una solución
tecnológica eficiente.
Formulación del Problema
¿De qué manera la implementación de un sistema de inteligencia de negocios
ayudará a los miembros del equipo desarrollador del sistema ABC de la
Democracia a realizar una toma de decisiones estratégica?
Evaluación del Problema
Las organizaciones públicas y privadas obtienen cada vez más datos de las
actividades que realizan a diario y en este caso se obtendrá de los registros de los
ciudadanos que se capacitan en un portal web de donde se harán diferentes
análisis como por ejemplo saber la cantidad de ciudadanos que se capacitan por
8
ciudad, para esto ha surgido en la actualidad una herramienta tecnología para las
empresas llamada Inteligencia de Negocios (Business Intelligence) haciendo
posible recabar datos que no están organizados que luego serán estructurados y
homogenizados para que sea de apoyo en la correcta toma de decisiones
permitiendo un verdadero potencial competitivo .
Los aspectos generales de la evaluación son las siguientes:
Delimitado: Este proyecto busca demostrar la implementación de Inteligencia de
Negocios mediante el uso de la suite de programas de Pentaho BI. Por medio del
diseño de un Data Mart de donde se extraerá diferentes consultas para comprobar
la aceptación y el interés de los usuarios que se capacitan en un portal web. La
información usada es tomada de la base de datos de los usuarios que se han
registrado para su capacitación.
Claro: Este trabajo muestra cómo implementar Inteligencia de Negocios de una
manera sencilla y orientada sobre un área específica que es la capacitación
publica, se busca ser lo más claro posible al momento de aplicarlo de manera fácil
y que no presentará ningún problema al momento de instalar y acoplar los
diferentes programas necesarios para el trabajo.
Evidente: Siempre hay que buscar soluciones rentables Open Source que
permitan la toma de decisiones en base una información real y precisa
Concreto: Para explicar que el uso de Pentaho Bi permite a una organización
realizar una correcta toma de decisiones de una manera precisa y sencilla.
Original: porque su uso podría ayudar a otras organizaciones públicas al
momento de realizar la toma de decisiones estratégicas, ya que se puede contar
con una herramienta especializada que permite modelar, proyectar y optimizar en
el futuro las acciones de la organización.
Factible: al estudiar los programas que conforman la suite de Pentaho BI se
comprueba que las entidades públicas también la pueden usar para aplicar
Inteligencia de Negocios en algún área específica.
Identifica los productos esperados: el resultado del diseño de un Data Mart
para que sea de utilidad en una organización pública que desea realizar una
correcta toma de decisiones sobre un área específica
9
Alcances del Problema
El alcance de este proyecto es implementar un software de inteligencia de
negocios que permitirá a los miembros del equipo desarrollador del sistema ABC
de la Democracia medir el uso y aceptación de los ciudadanos que se capacitan
en su portal web permitiéndoles realizar una correcta toma de decisiones sobre
este proceso. Los alcances que tiene el proyecto son los siguientes:
Para hacer el proyecto se usó la suite programas de Pentaho BI Community
Edition que es open source, siendo esta herramienta muy eficiente ya que sus
aplicaciones pueden modificarse según las necesidades de la organización,
adaptarse de manera eficiente a cualquier infraestructura informática, también
contiene un portal web que permite la administración local y remota de la
información que se quiera consultar.
Por medio del uso de ETL (Extracción, Transporte y Carga) se procede a mover
la información de la base de datos del portal web a un Data Mart, este
procedimiento es proveído por la herramienta Pentaho Data Integration que
permite la migración de información sea esta mediana o grande sin dificultad y
también conectarse a diferente motores de bases de datos sean estos de licencia
gratuito o comercial.
El diseño del Data Mart estará basado en el esquema en estrella ya que su
estructura es fácil de modificar por el simple motivo de solo poseer una tabla de
hecho y varias tablas dimensionales. El alcance de un Data Mart estará limitado a
los requerimientos de los usuarios, si existiera una nueva petición se procederá a
cambiar su estructura y si no es posible se procede a construir otro Data Mart.
Según Matt Casters (2010):” Un JOB sirve para ejecutar las transformaciones
realizados en Pentaho Data Integration de manera secuencial desde la
creación de la tablas hasta la actualización de un Data Mart.”
Tomando en consideración el concepto establecido por Matt Casters los JOB son
herramientas que vienen incluida en Pentaho Data Integration y que permiten
mantener siempre actualizada la información y estará limitada al volumen de datos
que se generen diariamente en un Data Mart.
10
La construcción de los cubos estará limitada en la división del Data Mart, esto
permitirá realizar un mejor análisis de los datos requeridos. La división del Data
Mart es la siguiente:
Usuarios: Permite la construcción de los cubos para hacer el análisis de los
ciudadanos por:
Edad (menores de edad, jóvenes, adultos).
Género (gblti, masculino, femenino).
Tiempo (año, mes, día, hora).
Localidades: Permite la construcción de los cubos para hacer el análisis de los
ciudadanos por:
Provincia (Guayas, Esmeraldas, Pichincha como ejemplo).
Cantón (Guayaquil, Riobamba, Machala como ejemplo).
Parroquia (Letamendi, El Recreo, Sucre como ejemplo)
Cultura: Permite la construcción de los cubos para hacer el análisis de los
ciudadanos por:
Sector de residencia (urbana o rural).
Etnia (blanca, afro ecuatoriano, indígena, mestizo, otra etnia).
Discapacidad (si o no).
Cartilla: Permite la construcción de los cubos para hacer el análisis de los
ciudadanos por:
Calificación (rango de calificación del 1 al 10 solo tomando en consideración la
calificación de 7 hasta 10).
Norberto Mazón (2010)dijo:” El servidor de BI para Pentaho contiene las
funcionalidades necesarias para el procesamiento OLAP, además que fue
desarrollado totalmente en lenguaje Java, permite la navegación de los
cubos multidimensionales por medio de visualizadores como por ejemplo
Jpivot .”
11
Con el concepto que establece Norberto Mazón se establece que el servidor de
Pentaho BI permite que los cubos multidimensionales ya construidos sean
publicados para su análisis respectivo. El servidor de BI contiene un portal web
que puede ser accedido desde cualquier browser.
El BI server cuenta únicamente con el plugin Jpivot para análisis y que su
limitación es su difícil manejo para arrastrar los campos y métricas aparte de su
entorno gráfico muy deficiente al mostrar los diferentes tipos de gráficos
estadísticos, en cambio el plugin Saiku Analitics su única limitación es que hay
que descargarlo desde internet, pero que a su vez al usarlo demuestra que es muy
eficiente y permite la construcción de vistas de análisis dinámicos y una interfaz
de gráficos estadísticos es muy buena.
Uno de los alcances de usar Pentaho BI Community Edition es que permite ahorrar
en costos su implementación ya que es un software Open Source, también es
versátil, fácil instalación, siempre en constante desarrollo, fácil manejo y también
puede conectarse a muchas base de dato sean estas comerciales o gratuitas. Una
limitación de usar Pentaho es que su uso todavía no está del todo extendida ya
que es una herramienta que lleva pocos años de haberse conocida a diferencia
de otras que llevan más tiempo en el mercado.
Según Michael McLauhlin (2013):”Mysql Workbench es una herramienta
visual creada para la gestión de base de datos, una de sus ventajas es ser
multiplataforma ya que puede ser implementado en distintos sistemas
operativos como Windows, Linux y Mac Ox y además que es software open
source muy rentable.”
El concepto formulado por Michael McLauhlin permite razonar que la base de
datos Mysql Workbench de donde se extraerá la información y también la que
contendrá el Data Mart es una herramienta factible por tener un buen ambiente
gráfico y una serie de herramientas que sirven para el desarrollo de todo tipo de
proyectos vinculados a la gestión de la información, aparte de que su
implementación en la plataforma informática de una organización no incidiría
muchos gastos ya que se puede encontrar en distintas versiones para los sistemas
operativos más usados en el mercado y otra ventaja es que el costo de usarlo es
0 ya que es totalmente gratuito.
12
OBJETIVOS DE LA INVESTIGACIÓN
Objetivo general
Implementar una solución de Inteligencia de negocios mediante el empleo de
Pentaho BI Community Edition para que los miembros del equipo desarrollador
del sistema ABC de la Democracia puedan realizar una correcta toma de
decisiones estratégicas sobre el uso y aceptación de los ciudadanos que se
capacitan en el sistema.
Objetivos específicos
Recolectar la información específica de los usuarios para obtener los
requerimientos necesarios en la implementación de inteligencia de negocios.
Determinar la base de datos que se usará en la implementación de inteligencia de
negocios para determinar que cuales son los elementos que conforman cada tabla
y sus conexiones.
Crear un esquema en estrella para definir la tabla de hechos y las dimensiones
que tendrá el Data Mart a partir de los datos extraídos de la base de datos
Diseñar la estructura que tendrán los cubos multidimensionales necesarios
mediante el uso del Data Mart propuesto para obtener consultas verídicas y no
erróneas.
Construir las distintas vistas de análisis mediante el uso de los cubos
multidimensionales planteados por medio de un visualizador OLAP para poder
realizar diversas observaciones.
JUSTIFICACIÓN E IMPORTANCIA DE LA INVESTIGACIÓN
Actualmente las organizaciones buscan automatizar sus propios procesos de
extracción de información siendo importante para el análisis de un área específica
de negocios y para eso implementan un software basado en inteligencia de
negocios que les facilitaría realizar estos procesos de manera rápida y eficiente,
por este motivo las organizaciones como el Consejo Nacional Electoral justifican
la implementación de inteligencia de negocios en sus procesos de gestión de
información para la toma de decisiones estratégicas por medio del uso de la
plataforma open source como Pentaho BI que les permitiría medir la aceptación y
uso de portal web por los ciudadanos que se capacitan.
13
El trabajo investigativo permite al autor del proyecto poner en práctica los
conocimientos adquiridos en la Carrera de Ingeniería en Networking y
Telecomunicaciones en un ambiente realista que será de provecho a la sociedad
como en este caso medir el conocimiento de los ciudadanos acerca del código de
la democracia.
En la práctica este trabajo investigativo consiste en agilitar y automatizar el
proceso de gestión de la información y cuya meta es ofrecer una correcta toma de
decisiones por medio de una herramienta informática que cumpla con las
expectativas del Consejo Nacional Electoral
En conclusión esta investigación permite encontrar una solución factible al
problema propuesto que en este caso es poder medir la aceptación y uso de los
ciudadanos sobre la capacitación online acerca del código de la democracia, que
al final servirá como una idea que se usará para corregir, reducir y por último
borrar todas las distintas fases que componen el problema.
La utilidad de implementar inteligencia de negocios es para reducir el tiempo de
consulta, facilidad de acceso a la información requerida, optimización de los
recursos, y mejora de los procesos que permiten una correcta toma de decisiones
a partir de la información que es generado por una organización.
Son muchos los métodos que se pueden utilizar para elaborar un proyecto basado en
Inteligencia de Negocios y en este caso se procedió a usar el método investigativo en
donde se emplea la lectura de manuales, libros, artículos científicos, revistas y sitios web
que permiten obtener los conocimientos necesarios para realizar esta investigación.
Los motivos para usar software basado en Inteligencia de Negocios es por ser una
solución segura, moderna y útil para todo aquel usuario que desee emplearlo
siempre que esté capacitado para utilizarlo, por esta razón se asegura que aporta
mucho al desempeño de sus funciones diarias al ser esta tecnología beneficiosa
para emprenderla.
Los beneficios para usar Inteligencia de Negocios es porque permite a las
autoridades de una organización obtener siempre al alcance un análisis eficaz de
la información, consultas agiles, reportes dinámicos, mejor procesamiento de los
datos, ahorro de recursos humanos y disminución de costos tanto en hardware
como en de software a la hora de implementarlo.
14
Una forma de realizar este trabajo es por medio de la consulta de diferentes
fuentes de información extraída por ejemplo la búsqueda de casos de estudio en
el internet, revistas científicas, manuales, encuestas a expertos en el tema, libros
videos, etc., que sirven para buscar una solución práctica al problema de
investigación propuesto.
La factibilidad de aplicar la Inteligencia de Negocios es porque el software
empleado posee una plataforma web para la elaboración de informes dinámicos
que permiten una información detallada de forma estadística de los datos
extraídos del portal web de capacitación sobre el código de la democracia
permitiendo a equipo desarrollador del sistema hacer una correcta toma de
decisiones.
15
CAPÍTULO II
MARCO TEÓRICO
Antecedentes
En la actualidad las organizaciones públicas o privadas deben necesariamente
implementar Inteligencia de Negocios para realizar una eficiente toma de
decisiones sobre un área específica de negocio. Aquí se muestran algunos
trabajos relevantes sobre el uso de Inteligencia de Negocios:
(Claudia Estefanía Jaramillo Mejía, 2015) dice: “al proceder a un análisis de
los datos generados por un área como por ejemplo verificar el inventario se
puede crear un Data Mart que permita la generación de reportes gerenciales
que facilitan de información clara para la toma de decisiones por medio del
empleo de software open source”. Demuestra que si se efectúa un análisis a
profundidad de los datos generados en este caso del portal web para la
capacitación online hace posible una toma de decisiones estratégicas por medio
del empleo de un Data Mart de donde se generaría los reportes dinámicos y vistas
de análisis.
(Cristian Darío Álvarez Calvopiña y Diego Armando Esparza Montes, 2014)
hace la siguiente observación: “El objetivo de estructurar toda la
información de una base de datos de áreas específicas como la de ventas
de una institución se puede lograr mediante la aplicación de un software
para inteligencia de negocios.” Es posible llegar a procesar la información de
una base de datos en este caso del portal web de capacitación mediante la toma
de decisiones estratégicas por medio de un software open source para inteligencia
de negocios que permita la construcción de reportes e indicadores.
16
(Ing. Marco Vinicio Guachimboza Villalva Espinoza Ce, 2012) dice: “El uso
de software para implementar inteligencia de negocios sirve para hallar las
relaciones aun no descubiertas de una base de datos transaccional que será
muy necesaria para toma de decisiones estratégicas en cualquier área
específica de negocio de una empresa.”
Por medio del empleo de un software para inteligencia de negocios se puede llegar
a reconocer cuales son las relaciones que no han sido descubiertas de una fuente
de datos en este caso de la base de datos del proyecto y también realizar una
toma de decisiones estratégicas de un área específica como en este caso el
proceso de capacitación acerca del código de la democracia.
(Horacio Hazael González Marroquín, 2012) dice: “si se verifica la viabilidad
de usar las metodologías y herramientas que ofrece la inteligencia de
negocios para poder analizar un sector específico de negocio.”
El empleo de las diferentes metodologías y herramientas que tiene la inteligencia
de negocios hace posible medir la aceptación y uso del portal web acerca del
aprendizaje sobre el código de la democracia.
(Alejandro Rojas Zaldívar, 2014) dice: “La implementación de un software
para inteligencia de negocios en un área específica perteneciente a
cualquier institución solo es posible si se dispone de información
confiable.” Solo si se dispone de una fuente de información segura y confiable es
posible llevar a cabo la implementación de inteligencia de negocios, en este caso
se utiliza la base de datos del proyecto llamada abc_democracia.
FUNDAMENTACIÓN TEÓRICA
El Consejo Nacional Electoral necesita implementar una solución de Inteligencia
de Negocios para el análisis del uso y aceptación de los ciudadanos que se
capacitan en el portal web acerca del código de la democracia por medio de la
toma de decisiones estratégicas. Ahora se usa un marco referencial para exhibir
los conceptos que permitan entender los objetivos del proyecto, entre los temas
que servirán para fundamentar teóricamente proyecto son los siguientes:
17
Inteligencia de Negocios (Business Intelligence)
Según Josep Luís Cano (2007) afirma: “La Inteligencia de se la puede definir
como la transformación de los datos que están acumulados en una empresa
para extraer el conocimiento de un área de negocio.”.
En base al concepto de Luis Cano se entiende que la Inteligencia de Negocios es
una tecnología de la información que permite la transformación de los datos
almacenados de una base de datos en información estructurada y cuyo objetivo
es deducir la situación actual de una organización y también predecir que puede
suceder a futuro, en pocas palabras permite la toma de decisiones estratégicas
sobre un área específica de negocio que en este caso servirá para medir el uso y
aceptación de los ciudadanos sobre del portal web de capacitación acerca del
código de la democracia.
Desarrollo del proyecto de Inteligencia de Negocios
Ahora se procede a detallar cuales fueron las actividades que se realizaron para
poder cumplir los objetivos establecidos en la investigación:
Observar cómo funciona el portal web de capacitación.
Revisar qué información se guardan en la base de datos.
Determinarlas las ventajas y desventajas de varias herramientas para inteligencia
de negocios.
Levantar la información necesaria para poder implementar un software para
inteligencia de negocios mediante el estudio de las herramientas informáticas y el
hardware disponible.
Proceder al diseño del Data Mart usando las metodologías disponibles para
inteligencia de negocios y que se compone de los siguientes pasos:
Planificación:
Se determina el objetivo específico y el alcance del proyecto.
Análisis de requerimientos:
Aquí se definen los requerimientos necesarios para planificar y desarrollar el
proyecto.
Modelado Dimensional:
Se deben identificar las variables del negocio para la creación del modelo
dimensional.
18
Diseño del sistema de Extracción, Transformación y Carga (ETL):
Es donde se crean el diseño para la extracción de los datos desde su
origen y guardarlo en un Datawarehouse.
Especificación y desarrollo de aplicaciones de BI:
Construir los cubos multidimensionales por medio del uso de un Data Mart y así
generar reportes dinámicos y vistas de análisis. También enseñar a los usuarios
a usar la plataforma informática para la inteligencia de negocios.
Pruebas:
Se realizan las últimas pruebas al proyecto con ayuda de los usuarios para poder
tomar las correcciones necesarias.
Beneficios de la implantación del BI
En la actualidad los sistemas de inteligencia de negocios abarcan nuevas áreas
de análisis como son recursos humanos, marketing, logística, etc., y no solo al
aspecto económico y financiero como se estableció en un principio. Entre los
beneficios que aporta el uso de inteligencia de negocios para el proyecto son los
siguientes:
Una mejor gestión de la información contenida la base de datos dimensional del
proyecto a la hora de realizar una consulta.
Mejor comunicación entre las personas encargadas de este proceso de
enseñanza online mediante la toma de decisiones de forma eficiente.
Tener a la mano reportes gerenciales que permitan medir la aceptación del portal
web por parte de los ciudadanos que se capacitan.
Obtener siempre información actualizada en el Data Mart de manera automática
sin necesidad de usar procedimientos manuales.
Reducción de tiempo a la hora de generar informes.
19
Fases del proceso de inteligencia de negocios
FIGURA N°1
Elaborado: Vicente Granja
Fuente: Desarrollo del proyecto
Por medio de esta figura se observan cuáles son las fases que componen el
proceso de inteligencia de negocios paso a paso para un mejor desarrollo de la
solución y son los siguientes:
FASE 1: Dirigir y Planear.
Donde se recolecta la información necesaria de los usuarios para poder entender
sus necesidades y de ahí formular las preguntas que servirán para alcanzar sus
objetivos. En este caso se hacen las entrevistas necesarias a las autoridades del
Consejo Nacional Electoral para conocer qué tipo de información desean consultar
como por ejemplo la edad de las personas que se capacitan en la noche.
FASE 2: Recolección de Información.
Es donde se procede a extraer desde una fuente de información de la organización
los datos que servirán para encontrar las respuestas formuladas de las preguntas
planteadas en la fase 1. Por lo general es recomendable que la información
provenga de una base de datos transaccional
FASE 3: Procesamiento de Datos.
Se procede en esta fase a integrar y cargar los datos extraídos de la fuente de
datos de la organización. Es aquí donde se crean las tablas dimensionales y de
hechos y para esto se utiliza Pentaho Data Integration que es parte de la suite de
programas pertenecientes a Pentaho BI
20
FASE 4: Análisis y Producción.
Es en esta fase es donde se procede a trabajar con los datos obtenidos para
poder obtener las respuestas formuladas de las preguntas hechas mediante el
empleo de gráficos estadísticos entre otras cosas.
FASE 5: Difusión.
En esta fase a los usuarios se les capacita en la utilización de las herramientas
para inteligencia de negocios y de esta manera les servirá para explorar los datos
de manera fácil y predecible.
Diferencias entre Data Warehousing y el Data Warehouse
Estas palabras claves aunque parecidas cumple diferentes roles en el proceso de
Inteligencia de negocios para este proyecto.
Data Warehousing (DWH): Sirve para la gestión de los datos en crudo que están
guardados en diferentes medios, formatos y tipos para comenzar a sanear y
componer es donde se podrá extraer, transformar y cargar los datos para su
posterior análisis y estudio.
Data Warehouse (DW): Es una base de datos con componentes
multidimensionales luego de aplicar los procesos que componen el Data
Warehousing.
Arquitectura del Data Warehousing
Mediante el empleo de una figura se describen cuáles son los componentes que
forman parte de la arquitectura de un Data Warehousing:
FIGURA N°2
Elaborado: Vicente Granja Fuente: Desarrollo del proyecto
21
La opinión de Juan Carlos Trujillo (2010) sobre: “Los almacenes de datos
son un conjunto de aplicaciones que se dedican a guardar datos históricos
para que puedan ser utilizados en la toma de decisiones.”
Haciendo uso de la observación de Juan Carlos Trujillo el Data Warehousing
consta en su ambiente de diversos elementos que son participativos entre si y que
tienen funciones propias dentro del sistema. Para resumirla de la siguiente
manera:
Los datos son extraídos de diferentes fuentes que en este caso serán de la base
de datos del portal web de capacitación denominado con el nombre de
abc_democracia, creado por medio del motor Mysql Workbench que permite ver
de manera muy eficaz la estructura de las tablas que la conforma como por
ejemplo observar que tipo de campos tiene.
Para que después sean integrados, transformados y limpiados por medio del
empleo de un ETL que servirá para cargarlos en el Data Warehouse. En esta
parte la suite Pentaho contiene una herramienta que hace simple esta función y
se llama Pentaho Data Integration que entre sus funciones es mantener siempre
actualizada la información de manera automática.
Es aquí en donde aquellos datos transformados se estructuran en cubos
multidimensionales que servirán para realizar las consultas dinámicas que han
sido plantadas por diferentes usuarios que en este caso son las autoridades de
Consejo Nacional Electoral. Por lo general su construcción depende de cómo este
estructurado y diseñado internamente el Data Warehousing.
Al final los usuarios pueden acceder a los cubos multidimensionales del Data
Warehouse utilizando las herramientas de exploración de datos y para que puedan
generar diversas consultas dinámicas facilitando la toma de decisiones. En esta
parte se emplea un visualizador OLAP que permite la construcción de diferentes
vistas de análisis y reportes dinámicos estadísticos, así también permitir que la
información requerida sea exportada en formato PDF, figura o en hoja de Excel.
22
Proceso de ETL (Extracción Transporte y Carga)
Según Josep Curto Díaz (2012) “El proceso ETL corresponde a un conjunto
de tecnologías que sirven para poder integrar los datos, es empleado para
sustentar un Datawarehouse.”
Tomando en consideración el concepto de Josep Curto se puede decir que la
utilización de un ETL es crucial para la integración de datos, ya que permite facilitar
el movimiento de datos, para luego transformarlos y luego cagarlos en un Data
Mart , para poder usar esta función en el proyecto se necesitó usar Pentaho Data
Integration. El término ETL corresponde a sus singlas en inglés así:
Extract: Extracción
Transport: Transporte
Load: Carga
Las fases del proceso ETL son los siguientes:
Extracción: Consiste en extraer los datos desde su origen.
Transporte: Consiste en la aplicación de reglas que permiten convertir los datos
que se van a cargar en un Datawarehouse.
Carga: Consiste en el destino de los datos que han sido cargados, por lo general
es el Datawarehouse.
Base de Datos Multidimensional
Según Josefina López herrera (2011):”La base de datos multidimensional es
usado en la creación de los Data Mart para diseñar los cubos
multidimensionales mediante el uso de un software para inteligencia de
negocios que servirá para la toma de decisiones. Un objetivo específico de
su uso es el procesamiento de grandes cantidades de datos.”
El concepto que define Josefina López permite esclarecer que la base de datos
multidimensional es una base de datos cuya información está conformada tanto
por tablas dimensionales y de hechos. Su estructura provee el acceso más rápido
a los datos y también en la ejecución de consultas al cubo usando herramientas
multidimensionales para su análisis.
23
Se recurre al empleo de la herramienta Pentaho Data Integration para poder
emplear el esquema en estrella en el desarrollo de la base de datos
multidimensional o centralizada del proyecto por ser la más fácil y empleada en
muchos trabajos que realizan la inteligencia de negocios ya que su estructura es
fácil de manipular a la hora de realizar algún cambio.
Tabla de dimensiones
Las tablas dimensionales permiten analizar el argumento del negocio, ya que
representan las vistas de interés y por ellos los usuarios pueden filtrar y manipular
información almacenada en la tabla de hechos. Una característica clave es que
contienen datos cualitativos que permiten tener un mejor enfoque o punto de vista
de lo que se quiere consultar.
Haciendo uso de la imagen mostrada a continuación que pertenece al proyecto
muestra como está estructurada una tabla dimensional, en donde se observa que
cada tabla contiene una clave primaria y ninguna clave foránea, aparte de que
solo tiene un campo que muestran que cualidades contienen como por ejemplo la
tabla d_genero tiene un campo llamado Genero que servirá para realizar
diferentes análisis sobre las personas que se capacitan sean masculina, femenina
o GBLTI
FIGURA N°3
Elaborado: Vicente Abel Granja Cevallos Fuente: Base de Datos del Proyecto
Tabla de hechos
Contienen los indicadores del negocio que al final permiten la toma de decisiones.
La composición de los datos es cuantitativo, los datos que pueblan la tabla hechos
no son solo sumas sino también promedios, mínimos, máximos, totales,
porcentajes, entre otras instrucciones matemáticas, siempre pendiente de los
requerimientos de análisis de la información del negocio.
24
La figura a continuación muestra la estructura de una tabla de hechos del proyecto,
en donde se observa que contiene una clave primaria y varias claves foráneas que
pertenecen a la demás tablas dimensionales que a su vez están conectadas con
ella y también tiene campo llamado Cant_veces que permite realizar las métricas
necesarias. También se puede observar que tipo de datos contiene cada
elemento.
FIGURA N°4
Elaborado por: Vicente Abel Granja Cevallos Fuente: Base de Datos del Proyecto
Tipos de modelamiento de un Data Warehouse
Esquema en estrella
Según J.A Calle (2005):” El esquema en estrella está constituida por una
tabla central o de hechos y que es construida por medio de las tablas de una
base de datos transaccional, a su vez está conectada con las tablas
dimensionales, para el esquema en estrella es preferible crear un repositorio
para poder usar las herramientas de extra acción de datos”.
De acuerdo al concepto de Calle se define que el esquema en estrella se compone
solo de una tabla de hechos y de varias tablas dimensionales relacionadas a
través de sus concernientes claves.
25
FIGURA N°5
Elaborado: Vicente Abel Granja Cevallos Fuente: Base de Datos del Proyecto
En la figura mostrada se observa como está estructurado un Data Mart según el
esquema en estrella en donde se observa claramente que solo tiene una tabla de
hechos y que a su vez contiene las claves foráneas que permiten la conexión con
las demás tablas dimensionales.
Características del esquema en estrella:
Una mejor repuesta de tiempo.
Contiene datos redundantes.
Se puede modificar de forma fácil.
Es muy buena para su interacción con herramientas de análisis y consulta.
Hay un paralelismo entre el diseño y la forma en que los usuarios pueden
representar y estudiar.
Cubo Multidimensional
Según Jane Price Laudon (2014):”Para un correcto procesamiento de
análisis se construye un cubo multidimensional que permite la vista y
consulta de forma rápida grandes cantidades de datos”.
Tomando en consideración lo establecido Jane Price se concluye que un cubo
multidimensional convierte los datos que se encuentran en filas y columnas en una
matriz de n dimensiones, para el desarrollo del proyecto los cubos
26
multidimensionales solo se le pueden agregar hasta 4 dimensiones para poder
hacerla más comprensible a la hora de realizar una consulta en ellas cuando sean
publicados en un servidor para inteligencia de negocios y sus componentes son
los siguientes:
Indicadores: evaluaciones que están basadas en sumarizaciones que
pertenecen a la tabla de hechos
Atributos: son los criterios de análisis que pertenecen a las tablas dimensionales
y que permiten filtrar los datos para hacer los análisis
Jerarquías: es la representación lógica entre los atributos
FIGURA N° 6
Elaborado: Vicente Granja Fuente: Desarrollo del proyecto
Como se observa en la figura este cubo contiene 3 dimensiones que pueden
combinarse con varios indicadores que en este caso serían 4 y 5 valores, en pocas
palabras en el caso de la intersección pintada de amarillo se puede observar que
contiene el indicador 1 que contiene el atributo 1 que a su vez tiene el valor de 4
y la dimensión 3.
Herramientas para visualizar los cubos multidimensionales
Según Oscar Dalfovo (2001):”En toda suite de programas para inteligencia
de negocios el componente OLAP es necesario que venga como parte de
ella. Esta interfaz es la parte donde más se han invertido recursos para
27
hacerlo potente, atractivo y usable a la hora de hacer análisis para la toma
de decisiones estratégicas.”
El concepto establecido por Oscar Dalfovo describe que estas herramientas
permiten la capacidad de analizar y explorar los datos. Los usuarios al navegar y
profundizarse en los datos pueden analizar los detallas para proporcionar un
análisis interactivo de las diferentes dimensiones de los datos como por ejemplo:
producto, cliente, región geográfica y por diferentes niveles que puede ser por
tiempo: año, mes, día. En el proyecto se hiso el empleo del visualizador Saiku
Analitics, cuya función es permitir la navegación entre los diferentes cubos
multidimensionales publicados para poder generar reportes como por ejemplo
verificar la cantidad de personas que se capacitan por edad en el horario de la
noche. Al utilizar estas herramientas permiten al usuario pasar de una visión
estática a una dinámica, pudiendo modificar el nivel de detalle y cambiar las
dimensiones para poder analizar la información.
¿Qué es Pentaho Bussines Intelligence?
Es un proyecto nació bajo la iniciativa de la comunidad Open Source que provee
a las empresas, entidades, organizaciones, etc. soluciones a sus necesidades de
Inteligencia de Negocios. Los servicios que ofrece la plataforma Pentaho Bussines
Intelligence incluyen programación, seguridad, integración, automatización y flujo
de trabajo. Proporcionando a los usuarios finales de Pentaho habilidades y
otorgándoles un lugar central para la administración así como el despliegue de la
organización. El proyecto Pentaho BI incluye las siguientes áreas: Informes
Dashboards, Cubos OLAP, Procesos ETL, Data Mining.
Según Jordi Conesa Caralt (2010) “Pentaho desde su creación en el año 2006
es una de las suites más rentables que hay en el mercado, en donde
podemos elegir entre la versión Enterprise y Community”.
Lo que define Jordi Conesa es que la suite de Pentaho contiene las herramientas
que son necesarias para el desarrollo de cualquier proyecto para inteligencia de
Negocios, para el desarrollo del proyecto se escogió la versión Pentaho
Community Edition por ser eficiente en el uso y rentable al economizar recursos
económicos al ser Open Source. Las herramientas que la conforman son las
siguientes:
28
Pentaho Data Integration (PDI)
Esta herramienta es la más útil de la plataforma de Pentaho BI ya que permite
transformar y cargar los datos que se necesita para su análisis así como también
crear una figura completa del negocio, también puede migrar información de
grandes bases de datos. Evita la utilización de código complejos para poder
estudiar la información procedente desde cualquier fuente haciéndola muy
eficiente ya que evita la ejecución de tareas muy complejas. Es aquí en donde se
realizan las tareas más complejas del proyecto ya que primero se debe analizar
los componentes de la base de datos transaccional para luego obtener las
diferentes tablas dimensionales y de hechos para la construcción de un Data Mart
por medio del empleo de uno o varios ETL que permitirán la trasformación de los
datos.
Pentaho Schema WorkBench (PSW)
La plataforma Pentaho BI proporciona una solución llamado Pentaho Analisys
Services que está basado en Mondrian, siendo este su corazón para el diseño y
desarrollo de cubos multidimensionales que luego son estudiados por un
visualizador OLAP que sirve como una herramienta de análisis al usuario, donde
puede realizan la navegación dimensional en los cubos desde la plataforma BI y
también poder visualizar las consultas. Los resultados relacionales son traducidos
a dimensiones gracias a Mondrian que a su vez es mostrado al usuario final en
formato HTML. Por medio de esta fantástica herramienta grafica se puede
construir los cubos multidimensionales del proyecto necesarios sin necesidad de
usar código fuente utilizando los elementos que contienen los Data Mart
diseñados, ya que solo hay que arrastrar los componentes necesarios como por
ejemplo las dimensiones, medidas, jerarquías e irlos configurando a medida que
se avanza y luego al finalizar la tarea se los publica para su análisis, en vez de
utilizar Jpivot que viene por defecto en Pentaho se utilizó la plataforma de Saiku
Analitics que permite una mejor navegación de los cubos multidimensionales de
donde se obtendrán las diferentes vistas de análisis de manera gráfica y dinámica
Pentaho Report Designer (PRD)
Permite la creación de reportes agradables y de forma rápida, que consta de un
entorno visual amigable. Dirigido a usuarios que estén acostumbrados con los
29
conocimientos y las fuentes de datos utilizables. En esta herramienta solo se crean
los reportes necesarios haciendo uso de sentencias SQL y que a su vez presenta
un reporte dinámico que puede ser exportado a cualquier formato como por
ejemplo PDF o ser publicado en el servidor BI de Pentaho para su respectivo
análisis
FUNDAMENTACIÓN SOCIAL
Es el impacto de este proyecto es para promover la utilización del software libre
en instituciones públicas basado en el decreto presidencial 1014 y en la que uno
de sus objetivos es la de ahorrar recursos económicos y que a su vez pueden ser
invertidos en otras áreas sociales como la salud.
Este proyecto promete medir el nivel de conocimiento de los ciudadanos del
Ecuador sobre el código de la democracia y entre sus objetivos es que conozcan
sobre sus derechos políticos como elegir y ser elegidos por ejemplo, el impacto
relevante en la comunidad es especialmente en el área de la educación
universitaria sobre todo en el manejo de herramientas tecnológicas open source
de los últimos años, que permite a los estudiantes ser competitivos como por
ejemplo en el desarrollo de nuevas aplicaciones informáticas para el bien de la
sociedad civil.
Un punto a destacar es que la Senplades avala la utilización del software libre
para inteligencia de negocios en su plan para el buen vivir, ya que en la actualidad
el uso de nuevas tecnologías están orientados a la fundación de nuevos tipos de
empresas que deben acoplarse a los modernos sectores de elevada
productividad en donde el objetivo fundamental es proponer la buena
competencia, la consolidación, la sostenibilidad y que también promueva a
inclusión económica.
Uno de los objetivos es proponer la impulsión financiera y no financiera de
recursos económicos en diversos proyectos que necesiten de la implementación
de nuevas tecnologías basada en la inteligencia de negocios para beneficio de la
sociedad. También impulsar de manera sistemática la inversión pública para
mejorar las condiciones que mejoren la buena competencia, también la apertura
de nuevos puestos de trabajo en el sector público y atraer la inversión privada por
medio de estudios sostenibles en base a la toma de decisiones estratégicas, uno
30
de los aspectos importantes en la utilización de esta tecnología es que permite
medir la factibilidad de diversas áreas que son parte de la sociedad como el
mediombiente, el uso de los recursos naturales renovables y no renovables, la
atención médica, la seguridad , la enseñanza, etc., siendo de utilidad para mejorar
los servicios en diferentes dependencias del estado.
FUNDAMENTACIÓN LEGAL
LEY DE COMERCIO ELECTRONICO.
Ley 67 de Comercio Electrónico, Firmas Electrónicas y Mensajes de Datos, de
2002.
Artículo 2. Reconocimiento jurídico de los mensajes de datos.- Los mensajes de
datos tendrán igual valor jurídico que los documentos escritos. Su eficacia,
valoración y efectos se someterá al cumplimiento de lo establecido en esta Ley y
su reglamento.
Decreto Ejecutivo No. 3496, R.O. 735 de 31 de Diciembre del 2002. Reglamento
de la Ley de Comercio Electrónico, Firmas Electrónicas y Mensajes de Datos
Artículo 10. Elementos de la infraestructura de firma electrónica.- La firma
electrónica es aceptada bajo el principio de neutralidad tecnológica. Las
disposiciones contenidas en la Ley 67 y el presente reglamento no restringen la
autonomía privada para el uso de otras firmas electrónicas generadas fuera de la
infraestructura de llave pública, ni afecta los pactos que acuerden las partes sobre
validez y eficacia jurídica de la firma electrónica conforme a lo establecido en la
ley y este reglamento.
DECRETO PRESIDENCIAL
CONSIDERANDO:
Que en el apartado g) del numeral 6 d la Carta Iberoamericana de Gobierno
Electrónico, aprobada por la IX Conferencia Iberoamericana de Ministros de
Administración Pública y Reforma del Estado, realizada en Chile el 1 de Junio de
2007, se recomienda el uso de estándares abiertos y software libre, como
herramientas informáticas; Que es el interés del Gobierno alcanzar soberanía y
autonomía tecnológica, así como un significativo ahorro de recursos públicos y
que el Software de Libre es en muchas instancias unos instrumentos para alcanzar
estos objetivos;
Que el 18 de Julio del 2007 se creó e incorporó a la estructura orgánica de la
31
Presidencia de la República la Subsecretaría de Informática, dependiente de la
secretaría general de la Administración mediante Acuerdo Nº119 publicado en el
Registro Oficial No. 139 de 1 de Agosto del 2007; Que el numeral 1 del artículo 6
del Acuerdo Nº 119 , faculta a la Subsecretaría de Informática a elaborar y ejecutar
planes, programas, proyectos, estrategias, políticas, proyectos de leyes y
reglamentos para el uso de Software Libre en las dependencias del gobierno
central; y, En ejercicio de la atribución que le confiere el numeral 9 del artículo de
la Constitución Política de la república;
DECRETA:
Artículo 1.- Establecer como política pública para las entidades de la
Administración Pública Central la utilización de Software Libre en sus sistemas y
equipamientos informáticos.
Artículo 2.- S
Se entiende por Software Libre, a los programas de computación que se pueden
utilizar y distribuir sin restricción alguna, que permitan su acceso a los
Códigos fuentes y que sus aplicaciones puedan ser mejoradas.
Estos programas de computación tienen las siguientes libertades:
a) Utilización del programa con cualquier propósito de uso común
b) Distribución de copias sin restricción alguna
c) Estudio y modificación del programa (Requisito: código fuente disponible)
d) Publicación delo programa mejorado (Requisito: código fuente disponible)
Artículo 3.- Las entidades de la Administración Pública central previa a la
instalación del software libre en sus equipos, deberán verificar la existencia de
capacidad técnica que brinde el soporte necesario para el uso de este tipo de
software.
Artículo 4.- Se faculta la utilización de software propietario (no libre) únicamente
cuando no exista solución de Software Libre que supla las necesidades
requeridas, o cuando esté en riesgo la seguridad nacional, o cuando el proyecto
informático se encuentre en un punto de no retorno.
Para efectos de este decreto se comprende como seguridad nacional, las
garantías para la supervivencia de la colectividad y la defensa del patrimonio
nacional.
Para efectos de este decreto se entiende por un punto de no retorno, cuando el
sistema o proyecto informático se encuentre en cualquiera de estas condiciones:
32
a) Sistema en producción funcionando satisfactoriamente y que un análisis de
costo beneficio muestre que no es razonable ni conveniente una migración a
Software Libre
b) Proyecto es estado de desarrollo y que un análisis de costo - beneficio muestre
que no es conveniente modificar el proyecto y utilizar Software Libre.
Periódicamente se evaluarán los sistemas informáticos que utilizan software
propietario con la finalidad de migrarlos a Software Libre.
Artículo 5.- Tanto para software libre como software propietario, siempre y cuando
se satisfagan los requerimientos, se debe preferir las soluciones en este orden:
a) Nacionales que permitan autonomía y soberanía tecnológica.
b) Regionales con componente nacional.
c) Regionales con proveedores nacionales.
d) Internacionales con componente nacional.
e) Internacionales con proveedores nacionales.
f) Internacionales.
Artículo 6.- La Subsecretaría de Informática como órgano regulador y ejecutor de
las políticas y proyectos informáticos de las entidades del Gobierno Central deberá
realizar el control y seguimiento de este Decreto.
Para todas las evaluaciones constantes en este decreto la Subsecretaría de
Informática establecerá los parámetros y metodologías obligatorias.
Artículo 7.- Encárguese de la ejecución de este decreto a los señores Ministros
Coordinadores y el señor Secretario General de la Administración Pública y
Comunicación.
Dado en el Palacio Nacional en la ciudad de San Francisco de Quito, Distrito
Metropolitano, el día de hoy 10 de abril de 2008
IDEA A DEFENDER
La implementación de un software open source de inteligencia de negocios que
servirá los miembros del equipo desarrollador del sistema ABC de la Democracia
medir la aceptación y uso de los ciudadanos sobre el portal web de capacitación
por medio de la toma de decisiones estratégicas a través de la construcción de un
Data Mart de donde se obtendrán los cubos multidimensionales necesarios para
la generación de reportes dinámicos y diferentes vistas de análisis.
33
DEFINICIONES CONCEPTUALES
BASE DE DATOS RELACIONAL: Es un conjunto de tablas cuyo contenido está
compuesto por datos que están dotados en categorías ya definidas. Las tablas
están compuestas de una o más categorías ubicadas en columnas y filas que son
instancias únicas de datos siempre definidos por las columnas.
Las tablas siempre van relacionadas unas con otras.
DATA MINING: Es una tecnología de la informática que permite la exploración de
grandes base de datos, cuyo objetivo principal es buscar y encontrar los patrones
que se repiten, tendencias o reglas que sirven para el análisis y de los datos.
DATA WAREHOUSE: Es un almacén de datos utilizada para integrar y depurar
la información, permitiendo realizar los análisis que han sido planteados por medio
de un proceso. Pueden contener más de un Data Mart permitiendo siempre tener
integrado todos los datos de una organización haciéndolo confiable para una toma
de decisiones.
DATASOURCE: Es la fuente de datos configurada por el usuario y que servirá
para conectarse a una base de datos. Los Datasource por lo general vienen
programados en el lenguaje de java.
DATA MART: Es una base de datos especializada en un área específica del
negocio, cuya característica destacable es la estructura optima de los datos para
un óptimo análisis. Por lo general los DATA MART son parte de una DATA
WAREHOUSE y siempre vienen estructurados en modelos de estrella o copo de
nieve.
GPL: Es conocido como Licencia Pública General y sirve para la publicación de
software libre. El objetivo es proteger al software de todo tipo de apropiación que
limita esa libertad a los usuarios.
INTELIGENCIA DE NEGOCIOS: Es un conjunto de estrategias y aspectos de
forma relevante que permite administrar y crear un conocimiento a través del
análisis de los datos que existen en una organización o empresa.
KETTLE: Es una herramienta propia de Pentaho que permite la Extracción,
Transporte y carga (ETL) y que es necesario para realizar la integración de datos.
Por lo genera les una gran innovación en su enfoque basado en metadatos.
MONDRIAN: Es un servidor analítico de datos en línea cuya función es permitir a
los usuarios el análisis de complejas bases de datos en tiempo real.
34
OLAP (ONLINE ANALYTICAL PROCESSING): Es una solución usada en la
inteligencia de negocios, cuyo objetivo es hacer más ágil el procesamiento de
grandes bases de datos. Permite la fácil extracción y selección de datos para
poder verlos desde diferentes puntos de vista.
OPEN SOURCE: Es conocido como software de código abierto que permite a los
usuarios la modificación de su código de manera gratuita y sin restricciones de
una licencia. Por lo general no todo software gratuito no ofrece total acceso a su
código y en ocasiones viene restringido por lo que se necesita conseguir una
autorización.
PENTAHO: Es una suit de programas que sirven para implementar inteligencia de
negocios y cuyo licencia es gratuita. Su objetivo es la toma de decisiones y el
análisis de la información de un área específica de negocio.
XML: Es conocido como un lenguaje de marcas que permite el almacenaje de
datos de forma comprensible. Las características más destacables de XML es que
siempre está basado en texto, no sustituye al lenguaje HTML y carece de un visor
genérico.
MONDRIAN: Es un servidor OLAP escrito en lenguaje de java que permite
analizar grandes cantidades de datos sin necesidad de recurrir en el uso de
sentencias en SQL siendo muy interactiva, es compatible con MDX (expresiones
multidimensionales) y XML (Lenguaje de consulta)
METADATOS: Forma parte de la estructura de un Data Warehouse
35
CAPÍTULO III
DISEÑO DE LA INVESTIGACIÓN
Modalidad de la investigación
La investigación presente está basada en la modalidad de investigación aplicada,
ya que el proyecto se considera que es factible para su realización porque permite
la solución de un problema real para el Consejo Nacional Electoral y que le servirá
a esta organización una mejor toma de decisiones sobre el proceso de
capacitación de los ciudadanos del ecuador sobre el código de la democracia.
Según Varela (2010):” Se entiende por factibilidad de un proyecto tiene como
fin la selección entre variantes para poder determinar qué características
técnicas para la operación, los medios para implementar y los costos para
poder realizar la operación”.
Tomando el concepto de Varela para conocer el planteamiento del problema se
muestra que es factible es proyecto por medio de la investigación aplicativa
basado en la lectura de diversas fuentes como libros o casos de estudio y la
recolección de los requerimientos, usando los procedimientos para determinar
cuáles son las actividades y los recursos para solventar una solución. Con la
investigación realizada en la acumulación de información se obtienen los
componentes que apoyaran a la búsqueda de la solución del problema con el fin
de terminar con éxito este trabajo investigativo
Tipo de investigación
Según Fidias G. Arias (2012):”Define que la investigación exploratoria nos
permite efectuar sobre un tema o también objeto que se desconoce y no
36
estudiado a fondo, que nos permite tener una aproximación superficial de
su conocimiento”.
Según lo establecido por Fidias Arias se tomó en cuenta para desarrollo del
presente proyecto la utilización de la investigación exploratoria ya que el estudio
de inteligencia de Negocios es un tema nuevo y que actualmente sigue en
desarrollo, aparte de que las empresas nacionales todavía no la implementan en
todas sus operaciones y solo en algunas áreas.
POBLACIÓN Y MUESTRA
Población
En este proyecto la población serán los ciudadanos que viven en la República del
Ecuador que son 16.144.363 millones de personas según el INEC en su último
censo poblacional hecho en el año 2010, por lo que la aplicación de una fórmula
matemática es impracticable debido a la cantidad de habitantes se procedió a
encuestar a expertos que conozcan sobre inteligencia de negocios.
Según José Guardia (2001):”Una población es el conjunto de sujetos o
individuos que tienen en común más de una característica y de donde se
obtiene la muestra para realizar un proceso investigativo. Se representa su
tamaño por medio de N.”
Muestra
Según Manuel Vivanco (2005):”Una muestra representa una colección o
subconjunto de elementos de una población, su tamaño es representado por
medio de n.”
En este proyecto la muestra son 100 especialistas que trabajan en el área de inteligencia
de negocios. A continuación se detalla su perfil profesional:
Cantidad de encuestados: 100
Hombres: 80
Mujeres: 20
Experiencia promedio: 3 años en el manejo de base de datos, programación en java,
manejo de diversas herramientas para inteligencia de negocios.
37
Promedio de edad: 26-53 años de edad.
La opinión de Richard L. Scheaffer (2012) sobre el muestreo dirigido es: “donde
los elementos de la población a analizar son escogidos por el investigador
ya que gozan de cierta representación, son de tipo no probabilístico”.
RECOPILACIÓN DE LA INFORMACIÓN
La fuente de investigación del proyecto se base en la búsqueda de manuales,
libros, revistas por internet pero de fuentes seguras, en la que haciendo su
respectivo análisis se pudo recolectar la información que se necesita para poder
hacer este trabajo mucho mejor.
INSTRUMENTOS DE RECOLECCIÓN DE DATOS
TÉCNICA
El uso de técnicas para poder solucionar el problema de una forma apta siempre
y cuando este elaborada correctamente para que tome una correcta trayectoria
sobre la actual existencia que se quiere encaminar.
La técnica usada es:
- La Encuesta: Está guiada a las personas que trabajan en el área de
inteligencia de negocios cuyo final es saber su conocimiento sobre esta
área específica de las ciencias de la información.
Según Elena Aboscal (2005):” Una encuesta es un método para obtener y
recolectar la información necesaria para la investigación por medio del uso
de un cuestionario verbal o escrito.”
INSTRUMENTOS
Los instrumentos deben estar conforme a la técnica usada y para este caso se ha
procedido al uso del cuestionario que es orientado al personal que trabaje
específicamente en el área de inteligencia de negocios de diferentes
organizaciones públicas o privadas y al final las respuestas obtenidas tabularlas
para su representación gráfica que hará sencilla su comprensión.
38
RECOLECCIÓN DE LA INFORMACIÓN
Se procede a la recolección y tabulación de la información por medio de la correcta
formulación de las preguntas de esta encuesta realizada sobre la muestra de 100
especialistas que conocen o han trabajado con inteligencia de negocios usando la
herramienta digital www.e-encuesta.com para distribuirla por medio de la red
social o email y así poder analizar y tabular la información recogida desde el 16 al
23 de Agosto del presente año.
39
PROCESAMIENTO Y ANÁLISIS DE LA ENCUESTA
PREGUNTA N° 1
1.- ¿Ha escuchado sobre lo que es Inteligencia de negocios?
TABLA N° 1
Conocimiento sobre Inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Si 75 75%
No 25 25%
TOTAL 100 100%
Fuente: Extraído de las encuestas Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 1
Conocimiento sobre Inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 75% de los profesionales encuestados conocen sobre lo que significa en verdad
la inteligencia de negocios, mientras el 25% no tiene un conocimiento efectivo
sobre esta herramienta.
75%
25%
Si No
40
PREGUNTA N° 2
2.- ¿Conoce usted que herramientas de inteligencia de negocios existen
actualmente?
TABLA N° 2
Conocimiento sobre herramientas de Inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Si 90 90%
No 10 10%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 2
Conocimiento sobre herramientas de Inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 90% de los profesionales conocen que herramientas están en el mercado,
mientras el 10% asevera que solo conoce la herramienta que usa en su trabajo y
por ende no conocen otras herramientas.
Si90%
No10%
Si No
41
PREGUNTA N° 3
3.- ¿Conoce alguna Plataforma de inteligencia de negocios: Comercial
(Licenciadas) u Open Source (Gratis)?
TABLA N° 3
Conocimientos de plataformas de inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Si 40 40%
No 60 60%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 3
Conocimientos de plataformas de inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 40% de los profesionales conoce la existencia de otras plataformas sean estas
Open Source o comercial, mientras el 60% de los profesionales asevera que no
conocen la existencia de otras plataformas y por ende están dispuestos a conocer
nuevas plataformas que mejorarían su desempeño.
71%
29%
Importante Poco importante
42
PREGUNTA N° 4
4.-En caso de administrar su propia empresa ¿Cuál de estas opciones
implementaría Comercial u Open Source?
TABLA N° 4
Opciones para implementar inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Comercial 75 75%
Open O Source 25 25%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 4
Opciones para implementar inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 75% de los profesionales dicen que implementarían la plataforma Open Source
para ahorrar costos, aparte de que el software es de licencia gratuita además que
es flexible y confiable, mientras el 25 5 prefiera la plataforma comercial porque
tiene mejor interfaz gráfica, soporte de mesa de escritorio en caso de fallar y mejor
compatibilidad con el software.
75%
25%
Comercial Open O Source
43
PREGUNTA N° 5
5.- En caso de administrar su propia empresa ¿Por qué razones no
implementaría BI?
TABLA N° 5
Razones para no implementar inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Falta de Recursos Monetarios 60 60%
No necesita implementarlo 40 40%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 5
Razones para no implementar inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLASIS DE LA PREGUNTA:
El 60 % de los profesionales dijo que no implementarían una solución de
inteligencia de negocios porque tendría que comprar hardware nuevo, contratar
persona o pagar por licencias si el software no es gratuito, el 40% de los
profesionales dijo que si el volumen de la información que maneja su empresa es
muy poca solo emplearían las herramientas convencionales para el análisis de
información como por ejemplo Microsoft Office para Windows o también Open
Office. Org calc que viene en la distribución de Fedora Linux.
60%
40%
Falta de Recursos Monetarios No necesita implementarlo
44
PREGUNTA N° 6
6.- ¿Conoce de alguna empresa que brinde soluciones de inteligencia de
negocios?
TABLA N° 6
Empresas que brinden solución sobre inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Si 10 10%
No 90 90%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 6
Empresas que brinden solución sobre inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 105 de los profesionales conoce la existencia de empresas dedicadas a brindar
solución sobre inteligencia de negocios radicadas en Ecuador como por ejemplo:
La Corporación Ekos, Noux Ca y Bi Solutions SA. Mientras el 90% de los
profesionales apenas conoce la existencia de otras empresas que brinden
soporte.
10%
90%
Si No
45
PREGUNTA N° 7
7.- ¿Cuán importante considera aplicar soluciones de inteligencia de
negocios para tomar decisiones?
TABLA N° 7
Aplicación de inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Muy importante 53 53%
Importante 32 32%
Poco importante 13 13%
Sin importancia 2 2%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 7
Aplicación de inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 53% de los profesionales considera que aplicar la inteligencia de negocios
mejoraría el análisis de un área específica del negocios, el 32% de los
profesionales solo la implementarían si encontraran fallas en el desempeño y
después buscar una solución, el 13% de los profesionales consideran poco
importante implementarla si el volumen de la información es muy poca y el 2% de
los profesionales encuetas opina que si su empresa es pequeña no la
implementarían y solo emplearían los métodos convencionales.
53%
32%
13%2%
Muy importante Importante Poco importante Sin importancia
46
PREGUNTA N° 8
8.- ¿Qué áreas importantes considera que deben ser analizadas en una
solución de inteligencia de negocios?
TABLA N° 8
Áreas para implementar inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
Optimización de costos 30 30%
Control financiero 35 35%
Análisis de perfiles de clientes 14 14%
Planificación de la producción 11 11%
Rentabilidad de un producto concreto 10 10%
TOTAL 100 100%
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 8
Áreas para implementar inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA
El 30% de los profesionales aplicaría inteligencia de negocios para medir los
costos de producción, el 35% de los profesionales implementar inteligencia de
Negocios ayudaría a verificar los gastos del presupuesto de su empresa, el 14%
de los profesionales opina que implementar Inteligencia de negocios les serviría
para analizar cuáles son los clientes que más consumen un servicio, el 11% de
los profesionales implementaría inteligencia de negocios les ayudaría a mejorar la
producción de un área específica y por último el 10% de los profesionales solo la
implementaría para verificar la aceptación de sus cliente por un servicio.
47
PREGUNTA N° 9
9.- ¿Qué tiempo usted invertiría en generar reportes gerenciales?
TABLA N° 9
Tiempo para generar reportes gerenciales
ALTERNATIVAS FRECUENCIA PORCENTAJE
0-2 Horas 70 70%
3- 4 Horas 15 15%
5-8 Horas 10 10%
Más de 8 horas 5 5%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 9
Tiempo para generar reportes gerenciales
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
El 70% de los profesionales opina que es necesaria tener siempre a la mano
reportes actualizados que permitirá mejorar el desempeño de las diferentes
personas de un área, el 15% solo para medir los objetivos a corto o largo plazo, el
10% para medir el impacto de venta de un producto de consumo masivo en un día
y el 5% para medir el desempeño del personal de alguna área específica del
negocio sea esta semanal, quincenal mensual o anual.
70%
15%
10%
5%
0-2 Horas 3- 4 Horas 5-8 Horas Más de 8 horas
48
PREGUNTA N° 10
10.- ¿Cuánto seria su inversión en implementar inteligencia de negocios?
TABLA N° 10
Inversión para implementar inteligencia de negocios
ALTERNATIVAS FRECUENCIA PORCENTAJE
0-500 77 77%
500-1500 10 10%
1500-2000 6 6%
Más de 2000 7 7%
TOTAL 100 100% Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
Gráfico N° 10
Inversión para implementar inteligencia de negocios
Fuente: Extraído de las encuestas
Elaborador por: Vicente Abel Granja Cevallos
ANÁLISIS DE LA PREGUNTA:
EL 77% de los profesionales solo invertirían 500 dólares solo para contratar a una
persona especialista en inteligencia de negocios teniendo todos los recursos
informáticos necesarios a disposición, un 10% de los expertos solo emplearía de
500 a 1500 dólares en contratar más de una persona experta si el proyecto para
implementar inteligencia de negocios es compleja, el 6% de los profesionales
invertirían 1500 a 2000 dólares si hay que pagar una licencia y mientras el 7% de
los expertos de los expertos si hubiera que comprar un nuevo equipo para
implementarlo .
49
Validación de la idea a defender
Por medio del empleo de encuestas realizadas a diferentes profesionales que
trabajan en el área informáticos se establece que la idea de implementar un
software para inteligencia de negocios en una organización sea esta privada o
pública puede ser usado para una mejor gestión de la información, aunque es
preferible que sea open source por el bajo costo de adquirirlo y aparte que en la
actualidad siempre está en constante desarrollo, permitiéndoles a las personas
que administran estas organizaciones sean gerentes o directores realizar una
correcta toma de decisiones que permitan medir la eficiencia de algún área
específica de negocio por medio del empleo de reportes dinámicos y vistas de
análisis, aunque el empleo de este tipo de software solo puede ser usado por
organizaciones grandes o medianas ya que poseen más departamentos o
manejan grandes cantidades de información, aparte de que pueden asumir el
costo de la implementación a la hora de contratar personal especializado o adquirir
nuevos equipos informáticos.
50
CAPÍTULO IV
PROPUESTA TECNOLÓGICA
Esta investigación está basada en la implementación de una solución de
inteligencia de negocios para poder medir el uso y aceptación de los ciudadanos
del Ecuador que se capacitan en el portal web acerca del código de la democracia,
en donde se emplea la suite programas de Pentaho BI Community Edition en
donde se mostrará los pasos detallados para la construcción de un Data Mart que
a su vez servirá para el diseño de cubos multidimensionales y de donde se
generarán las diferentes vistas de análisis que permitirán una toma de decisiones
estratégicas sobre esta capacitación.
Creación del Data Mart
SPRINT N° 1
1.- Aquí se detalla paso a paso la creación del Data Mart que entre sus funciones
permitirá como ejemplo realizar la vista de análisis sobe la cantidad de usuarios
que se registran por edad y donde lo primero que se hace es analizar la base de
datos transaccional del proyecto llamada abc_democracia que fue desarrollado
por medio del uso del motor Mysql Workbench Open Source en donde se
reconocerán como están relacionas la tablas, sus claves primaria y foráneas, las
filas y columnas, como se nota la base es demasiada grande para analizarla y se
procede a dividirla en dos gráficos.
51
IMAGEN N° 1
Fuente: Base de datos del Proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°2
2.- Aquí se detalla la otra parte de la estructura de la base de datos
transaccional en donde se muestran como están relacionadas las diferentes
tablas, este análisis se hace de esta manera porque la fuente de datos es muy
grande para analizarla en una sola pieza, en donde podemos ver los elementos
que la conforman como son sus claves primarias, las claves foráneas, las
relaciones entre ellas.
52
IMAGEN N°2
Fuente: Base de datos del Proyecto
Elaborador por: Vicente Abel Granja Cevallos
Sprint N°3
3.- Lo primero que se crea es el Job que es realizado en el Pentaho Data
Integration o Spoon que permitirá que se carguen la información actualizada a la
base de datos dimensional por medio de la programación de un periodo de tiempo
que puede ser por horas, días o semanas y también podrá realizarse de forma
53
manual, lo primer que se hace es dirigirse a la pestaña New y aparecen algunas
opciones de trabajo y escoge Job.
IMAGEN N°3
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°4
4.- Se abre en la parte izquierda diversas carpetas y a su vez contienen varias
aplicaciones así como herramientas en forma de gráficos como en este caso para
54
la construcción del Job se escogen los elementos de la carpeta general y Scripting
siendo estos los más usados para la construcción de un JOB
IMAGEN N° 4
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°5
5- Para que funcione correctamente el modelo se deben arrastrar los elementos
al panel de la izquierda y luego proceder a unirlos entre ellos quedando este
diseño para que pueda haber la transferencia de la información que permitirá
siempre tener al Data Mart actualizado.
IMAGEN N° 5
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
55
Donde también se observa que los elementos unidos realizan varias labores como
limpiar o borrar las tablas pero eso solo lo hace una vez, por ejemplo se observa
que la parte “llenado tabla dimensiones” activa los elementos que conforman la
transformación para el llenado de las tablas dimensionales.
SPRINT N°6
6.- Con el uso de sentencias SQL que al ejecutarse procede a limpiar, borrar, crear
las tablas dimensionales y de hechos configurados en los elementos que
conforman el Job y también permite la actualización de la información del Data
Mart de forma constante. En este ejemplo que se observa en la imagen este
código permite eliminar todas las tablas ya existentes para evitar alguna
redundancia en el repositorio que conforma el Data Mart.
IMAGEN N°6
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°7
7.- Ahora se procede a crear la conexión a la base de datos de donde se va a
procesar la información, este paso es necesario para poder extraer los datos.
56
IMAGEN N° 7
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
Los pasos a realizar son los siguientes:
• Establecer el nombre de la nueva conexión en Connection Name
• En Hostname ubicado en la parte izquierda se escribe localhost si la fuente
de datos es interno o si es externa se pone la dirección IP del origen
• En Database Name se pone el nombre de la base de datos centralizada
del Data Mart que es etl_democracia_registrados
• Se especifica en la parte derecha el tmotor de base de datos para la
conexión en este caso es Mysql y su acceso que es Native(JDBC).
• El número de puerto de la conexión de Mysql es 3306.
• Ponemos el nombre de usuario de la base de datos y la contraseña.
Y luego se presiona ok.
SPRINT N°8
8.- En otro proceso se realizan los diferentes esquemas del ETL en donde se ubica
en File luego en New y se escoge Transformation para poder tener solos los
elementos de entrada y salida que están ubicado en las carpetas input y ouput
que a su vez se arrastran al panel para luego conectarlas entre ellas el flujo de
información.
57
IMAGEN N° 8
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°9
9.- La creación de las tablas auxiliares solo sirven solo para poder utilizar la
información almacenada de ciertas tablas específicas para poder crear los
modelos dimensionales. Aquí se muestra un query realizado en lenguaje SQL que
permite crear la tabla auxiliar entrada_aux_cultura a partir de las tablas
transaccionales cne_autoidentificacion, cne_sector_rescidencia y cne_genero y
que a su ves la información será almacenada en una tabla de salida.
IMAGEN N°9
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
58
SPRINT N°10
10.- En este paso se muestra la configuración de una tabla de las salidas en donde
se muestra en donde se cargará la información procedente de la base de datos
transaccional, en donde se le pone un nombre a esta salida como se muestra en
esta imagen Salida_Hechos_usuarios, luego se pone la conexión de la base de
datos relacional y después el nombre de la tabla en donde se cargará la
información extraída.
IMAGEN N°10
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°11
11.- Luego se procede a la creación de todas las tablas dimensionales que se van
a necesitar para poder extraer los datos que serán cargadas al modelo
dimensional. Cada una de las entradas y salida han configuradas de manera
manual para que puedan realizar los procesos programados como se puede
apreciar en la imagen cada elemento ha sido arrastrada y unida en el panel y en
cada entrada contiene diferentes líneas de código fuente en lenguaje SQL que
permite realizar estos proceso.
59
IMAGEN N°11
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°12
12.-Ahora se proceda la creación de las tablas de hechos mostrado en el gráfico,
estas tablas contienen datos cualitativos y contienen las diferente métricas que
serán usadas para la creación de los cubos multidimensionales.
IMAGEN N° 12
Fuente: Spoon del proyecto
Elaborador por: Vicente Abel Granja Cevallos
60
SPRINT N°13
13.- Al final se han construido diferentes modelos que conforman el Data Mart con
sus respectivas tablas de hechos y de dimensión por medio de la ejecución de
las transformaciones creadas a partir del modelo transaccional como se observa
como están interconectadas las tabla por ejemplo la tabla de hechos Usuarios.
Hay que tener en cuenta que estos modelos permitirán la construcción de los
cubos de información.
Usuarios
IMAGEN N°13
Fuente: Base de datos Multidimensional
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N° 14
14.- Se muestra la tabla de hechos Localidades con todos sus elementos y
conexiones.
Localidades IMAGEN N° 14
Fuente: Base de datos Multidimensional
Elaborador por: Vicente Abel Granja Cevallos
61
SPRINT N° 15 15.- Se muestra la tabla de hechos cultura con todos sus elementos y conexiones.
Cultura
IMAGEN N°15
Fuente: Base de datos Multidimensional
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°16
16.- Se muestra la tabla de hechos cartilla con todos sus elementos y conexiones.
Cartilla
IMAGEN N°16
Fuente: Base de datos Multidimensional
Elaborador por: Vicente Abel Granja Cevallos
62
Creación del cubo multidimensional
Sprint N° 17
17.- Ahora una de las consultas de las autoridades es saber la cantidad de
usuarios registrados por rango de edad y el número de edad. Para eso se emplea
la herramienta Pentaho Schema Workbench que permite la construcción de un
cubo multidimensional, en donde se pueden arrastrar los elementos que se
necesiten que se necesiten sin necesidad de programarlos en lenguaje XML, ante
todo siempre tiene que haber la conexión a la base de datos para poder que
puedan ser creados como en este ejemplo en la imagen, en donde primero vamos
al menú y se escoge la pestaña opciones para elegir la opción Connection en
donde establecerá con que base de datos se va a trabajar, en este caso es el Data
Mart .
IMAGEN N°17
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N° 18
18.- Los pasos para hacer la conexión a la base de datos son los siguientes:
• En connectio Name establecemos el nombre de la nueva conexión.
• En Hostname se estable si el origen de los datos es local o externa
• En Connection Tipe se busca con que motor de base de datos se trabaja
en este caso Mysql.
• En Datbase name se escribe la base de daros de destino.
• En Port Number se escribe el número de puerto del motor de base de datos
en este caso 3306
• Luego en Use Name se escribe el nombre del usuario y en Password su
contraseña y luego se presiona ok y lista la conexión
63
IMAGEN N°18
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°19
19.- Ahora se dirige el cursor a la pestaña New y escogemos Schema que
permitirá la creación de un cubo multidimensional
IMAGEN N°19
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°20
20.- Se dirige el cursor donde está la imagen de un cubo se lo marca (Add Cube)
y se crea un ambiente para poder trabajar en el diseño. Al que se le pone el
nombre de Cub_Edades_R.
64
IMAGEN N°20
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°21
21.- Dando clic en el cubo “Cub_Edades_R.” se puede ver cómo se despliega un
icono llamado “Table”, pues en este lugar se selecciona la tabla hechos, es decir
la tabla que contiene elementos cualitativos aparte también la medida que
permitirá el análisis de lo que se desee consultar.
IMAGEN N°21
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
65
SPRINT N° 22
22.- Aquí se establecen dos Dimensiones una que contiene las edades y otra
que son el rango de edades, cada dimensión contiene una jerarquía o varias
jerarquías y de ahí niveles que a su vez sus datos se obtendrá de una tabla
dimensional llamada d_rangoedades en este caso se puede observar en la
imagen.
IMAGEN N°22
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N° 23
23.- Se configura la jerarquía, esta tiene dos atributos importantes que son: name
en la cual se debe asignar un nombre que represente a la dimensión, en este caso
se colocó Por_edades y la primary key que corresponde a la tabla d_rango
edades.
66
IMAGEN N°23
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°24
24.- Luego hacer click derecho encima de la jerarquía Por_Edades y seleccionar
la opción de Add Level para configurar los respectivos campos por los cuales se
quiere filtrar los indicadores, este componente tiene los siguientes atributos
importantes: el name el cual se refiere al nombre con el cual se identificará el
campo, column que es el campo de la tabla d_rangocalificacion , type que es el
tipo de dato de la columna, level type este se refiere si es campo pertenece a una
dimensión tiempo, en este caso se configura como regular, ya que no es parte de
una dimensión tiempo que se vaya a necesitar
IMAGEN N°24
67
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°25
25.- Seguidamente hacer click derecho en el cubo para añadir las dimensiones
que usa el cubo seleccionando la opción Add Dimension Usage, luego se
configura sus atributos como el name que se refiere a un nombre que identifique
la dimensión en cuestión, el foreing key que es la clave foránea de la dimensión
que está en la tabla de hechos añadida en el paso anterior llamada Rango y el
source que se refiere a la dimensión a usar que en este caso el Rango_Edades
configurada anteriormente este ítem queda configurado.
IMAGEN N°25
68
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°26
26.- El último paso es configurar los measures, medidas o indicadores del cubo
que están en la tabla de hechos respectivamente, para ello hacer click en el cubo
Cub_Edades_R y se escoge la opción de Add Measure y se configuran sus
atributos como el name en el cual va el nombre que mejor represente al indicador,
aggregator que se refiere a las función de sumarización de grupos (SUM, COUNT,
MIN, MAX, AVG, DISTINCTCOUNT) en este caso se selecciona SUM porque el
indicador que se quiere analizar represente el monto total de personas registradas
por edad; en la parte de column aquí se selecciona el campo que representa al
indicador en la tabla de hechos en este caso Registros.
69
IMAGEN N°26
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
Publicación del cubo para el análisis
SPRINT N°27
27.- Primero se ir al menú File y se pone Publish luego se abre una pantalla con
el nombre Publish Schema que permitirá alojar el cubo multidimensional en el
servidor web de Pentaho en donde se puede observar la dirección URL, el usuario
y password de quien administra la página del Bi server de Pentaho y al final se
pone la conexión con el DW en nuestro Pentaho BI Server.
70
IMAGEN N°27
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N° 28
28.- Una vez llenado los datos se procede a presionar en Publish lo que permite
publicar el cubo multidimensional que al final sale Publicación Exitosa para poder
realizar en un futuro el respetivo análisis.
IMAGEN N° 28
Fuente: Cubo de Datos en Pentaho Workbench
Elaborador por: Vicente Abel Granja Cevallos
71
Realizar una vista de análisis
SPRINT N° 29
29.- Ahora se procede a buscar a carpeta en donde se aloja el Bi server de
Pentaho en donde se busca el archivo Start Pentaho para poder activar los
servicios necesarios para administrar la página. Es necesario que esté instalado
la última versión de Java para poder gozar de todas las herramientas que contiene
el servidor
IMAGEN N°29
Fuente: Localización de carpeta de plataforma BI
Elaborador por: Vicente Abel Granja Cevallos
72
SPRINT N° 30
30.- Una vez activados los servicios se procede a digitar el URL de Pentaho que
sería el siguiente http://localhost:8080 y aparece una pantalla de bienvenida, en
donde se pone el nombre del usuario y el password de la persona que administra
el servidor web de Pentaho.
IMAGEN N°30
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
73
SPRINT N°31
31.- Una vez que se ingresa al sistema se procede a ubicase en Create New
ubicado en el costado izquierdo de color azul y con forma de rectángulo con letras
blancas en donde se escogerán las distintos visualizadores OLAP.
IMAGEN N°31
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
74
SPRINT N°32
32.- Y se escoge Saiku Analitics que es una herramienta de análisis Open Source
que permitirá la visualización del cubo para proceder a realizar un análisis.
Contiene una interfaz amigable para poder navegar en lo cubos de manera
dinámica.
IMAGEN N°32
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
75
SPRINT N°33
33.- Aquí se abre la página de opciones de Saiku para y se escoge Create New
Query ubicado al costado izquierdo con forma de rectángulo blanco con filos rojos
que permite poder realizar las consultas de los cubos que han sido publicados
desde el Schema Workbench.
IMAGEN N°33
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
76
SPRINT N° 34
34.- Para verificar si el cubo ha sido publicado con éxito se ubica en la parte que
dice “Cubos” y abajo dice seleccionar un cubo en donde se verifica si consta en el
listado.
IMAGEN N° 34
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°35
35.- Una vez escogido el cubo se procede a ubicar que elementos van a la
columnas y que otros a filas para que se pueda formar un cuadro que representa
la cantidad de personas registradas por edad y clasificadas por rango para
analizar cuál es la edad o rango con más frecuencia a capacitarse y poder tomar
77
alguna medida para que otras personas de otros rangos también procedan a
realizar la debida capacitación.
Algo que Saiku hace automáticamente es poner la medida en este caso es
Registrados ya que al ubicar las columnas y fila ya procede de manera automática
a filtrar los datos mostrando la cantidades. En la imagen mostrada se observa el
análisis en forma de una tabla dinámica.
IMAGEN N°35
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N°36
36.- Los análisis pueden observarse también con el empleo de gráficos
estadísticos como Pastel, Barra o Anillos, en este análisis puede observarse que
las personas que más se capacitan son los jóvenes adultos cuyo rango está
comprendido entre los 18 y 35 años
78
IMAGEN N°36
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
SPRINT N° 37
37.- Se muestra un análisis estadístico por medio de un pastel en donde se
puede mostrar diferentes porcentajes.
IMAGEN N°37
Fuente: Plataforma web de Pentaho BI
Elaborador por: Vicente Abel Granja Cevallos
79
Análisis de factibilidad
Para poder medir la factibilidad del proyecto se realizaron varias pruebas con la
ayuda de los estudiantes de las Carreras de Ingeniería en Sistemas y Networking,
en donde ellos procedieron a registrarse para la capacitación sobre el código de
la democracia por medio de un portal web y con los datos extraídos de aquel
aprendizaje se comprueba que los información de la base de datos del portal web
se carga de manera automática y sin errores en el Data Mart donde la manera de
comprobar que está actualizada es por medio de la generación de reportes
dinámicos usando un visualizador OLAP.
Factibilidad Económica
Cuadro N°1 Presupuesto Estimado
Rubros Dólares
Software Open Source Pentaho 0
Software de Base de Datos 0
Computador para el desarrollo 600
Suministros de oficina 10
Refrigerios 25
Textos de consultas 10
Transporte diario 160
Internet 0
Impresión de tesis 8
Total 813
Elaborado: Vicente Granja Fuente: Costos del proyecto
Factibilidad Técnica
Los requisitos técnicos necesarios para el desarrollo son proporcionados por el
Consejo Nacional Electoral en lo que se respecto al servidor para instalar
inteligencia de negocios y para los clientes que deseen utilizar este servicio,
80
Requisitos de Hardware
Computador para el desarrollador
Memoria Ram de 8 Gb
Disco Duro de 500 GB
Procesador i5 de 1.6 GHZ de
Puerto de red para conexión a internet
Computador para servidor
Memoria Ram de 8 Gb
Disco Duro de 500 GB
Procesador i5 de 2.6 GHZ de
Puerto de red para conexión a internet
Computador para el cliente
Memoria Ram de 4 Gb
Disco Duro de 320 GB
Procesador i3 de 2.6 GHZ de
Puerto de red para conexión a internet
Requisitos de Software
Computador para el desarrollador
Sistema operativo indistinto (Windows 7 o Centos versión 6.7)
Suite de programas de Pentaho BI Server Comunity Edition Versión 6.1
JDK versión 8
Motor de base de datos Mysql Workbench versión
Navegador web Google Chrome o Mozilla
Computador para servidor
Sistema operativo Centos versión 6.7
81
Suite de programas de Pentaho BI Server Comunity Edition Versión 6.1
JDK versión 8
Motor de base de datos Mysql Workbench versión 5
Computador para el clien
Sistema operativo indistinto (Windows 7 o Centos versión 6.7)
JDK versión 8
Navegador web Google Chrome o Mozilla
Factibilidad Operativa
Se cuenta con el apoyo sin condiciones de parte de las autoridades que conforman
el Consejo Nacional Electoral, que proporcionarán la información necesaria y los
requerimientos específicos tanto en software y hardware para poder realizar la
implementación factible del proyecto sin ningún problema, una vez finalizado se
procederá a ponerlo en la fase de producción para que generen de forma
inmediata los reportes dinámicos y vistas de análisis que permitirán la toma de
decisiones estratégicas.
También se procederá a la capacitación de los usuarios que van a interactuar
directamente con el software de inteligencia de negocios, en donde se les
explicara de manera detallada la instalación del software en un servidor especifico,
también se les enseñara como poner en funcionamiento los diferentes programas
que servirán para poder transformar los datos en información útil, se les ilustrara
como poder realizar las diferentes consultas y reportes. Así también se les
explicara qué hacer si en caso de que haya algún problema y volver a poner en
funcionamiento el sistema de inteligencia de negocios.
Factibilidad Legal
Es factible legalmente la implementación del proyecto en una institución del estado
ecuatoriano como es el Consejo Nacional Electoral porque el decreto ejecutivo
1014 establece como política pública a todas las instituciones del estado utilizar
software libre en sus sistemas y equipos informáticos.
82
El decreto explica lo siguiente en referencia al uso de software Open Source:
Artículo 1.- Establecer como política pública para las Entidades de la
Administración Pública Central la utilización de Software Libre en sus sistemas y
equipamientos informáticos.
Artículo 2.- Se entiende por Software Libre, a los programas de computación que
se pueden utilizar y distribuir sin restricción alguna, que permitan su acceso a los
códigos fuentes y que sus aplicaciones puedan ser mejoradas.
Estos programas de computación tienen las siguientes libertades:
a) Utilización del programa con cualquier propósito de uso común
b) Distribución de copias sin restricción
c) Estudio y modificación del programa (Requisito: código fuente disponible)
d) Publicación del programa mejorado (Requisito: código fuente disponible).
Tampoco hay impedimento legal de parte de los desarrolladores de Pentaho BI
Community Edition ya que es una herramienta Open Source que permite la
modificación de su código según las necesidades del proyecto.
Etapas de la metodología del proyecto
Para la elaboración de nuestro proyecto hemos escogido la metodología Scrum
para poder realizar un correcto trabajo en equipo. Se trata de realizar entrega
parciales del producto final, ya que esto nos permite en la realización de proyectos
complejos para poder obtener resultados de manera rápida, ya que siempre los
requisitos siempre tiende a cambiar donde lo fundamental es la innovación,
la competitividad, la flexibilidad y la productividad
Esta metodología nos permite resolver como ejemplo por ejemplo:
- entregas demasiadas largas
- Costos de proyectos
- La calidad del producto
83
Proceso de Scrum
El proceso de Scrum es ejecutable en bloque de tiempo por temporada corto o fijo
en la que cada interacción proporciona un resultado cumplido.
FIGURA N° 7
Elaborado: Tomado desde la fuente web
Fuente: proyectos ágiles
Planificación de cada iteración
Selección de requisitos
Donde el cliente establece los requisitos para la elaboración del proyecto.
Planificación de iteración
Donde se elabora una lista de tareas necesarias para poder cumplir con los
requisitos.
Ejecución de las iteraciones
Es donde se procede a la realización de las reuniones para saber cómo se está
realizando el trabajo.
Donde se realizan las siguientes preguntas que son siempre 3:
¿Qué he hecho desde la última reunión de sincronización?
¿Qué voy a hacer a partir de este momento?
¿Qué impedimentos tengo o voy a tener?
Inspección y adaptación
84
En donde se realiza la inspección a la iteración en el último día
Consta de lo siguiente:
-Demostración
De 4 horas limite en la que se presenta los requisitos completados en la iteración.
-Retrospectiva
De 4 horas limite en la que se analiza la manera de trabajar y los problemas que
pueden aparecer y como eliminarlos
A continuación se presentan las iteraciones del proyecto por medio de una tabla
que contiene todas las actividades realizadas:
CUADRO N° 2
Las iteraciones del Proyecto como Cronograma
Nº de
Actividad
Actividad
(Descripción de las mismas)
1 Estudio Inicial o Preliminar del Proyecto, Reuniones y convocatorias
para selección del personal
2 Diseño del proyecto, Formación de Grupos de trabajo y Definición de
Roles del Proyecto
3 Revisión y corrección del tutor, Capacitación sobre proyecto y
metodología de desarrollo
4 Levantamiento del ambiente de Pentaho BI Server
5 Levantamiento del ambiente de Pentaho BI Server con la base de datos
a usar
6 Realizar diferentes transacciones de la base de datos entre
computadores conectadas a una red
7 Construcción de los diferentes ETL que servirán para llenar las tablas
dimensionales Pentaho Data Integration
8 Construcción de los cubo de información a partir de la herramienta
Pentaho Schema Workbench
9
Subir a la plataforma del Pentaho BI Server para verificar las fallas y
corregirlas
85
10 Fase de Implementación del ambiente en producción para mostrar al
Scrum del proyecto
11 Fase de Implementación del ambiente en producción
12 Realizar los diferentes ETL y para llenar las tablas dimensiónales y
hechos
13 Fase de Integración y pruebas internas
14 Fase de Pruebas piloto y en producción
15 Fase de Cambios y mejoras del sistema
16 Fase de capacitación
17 Fase de documentación
18
Fase de Entrega del primera versión
Fuente: Extraído de las iteraciones de la herramienta Trello para Scrum
Elaborador por: Vicente Abel Granja Cevallos
Entregables del proyecto
Lo que se va a entregar en el proyecto es el manual de instalación y uso de la
aplicación Pentaho Data Integration así como también las preguntas de las
encuestas realizadas a los expertos y los códigos fuentes de cómo se crearon las
tablas dimensionales y de hechos para el proyecto basado en código SQL, todo
este material está ubicado en los anexos.
Criterios de validación de la propuesta
El objetivo de este proyecto es demostrar que la implementación de un software
para inteligencia de negocios que servirá para medir el uso y aceptación de los
usuarios sobre el portal web de capacitación acerca del código de la democracia
por medio de la toma de decisiones siendo factible para las autoridades del
Consejo Nacional Electoral.
En un periodo de pruebas se han hecho diferentes análisis del proyecto como por
ejemplo la prueba de los ETL, probar de forma local la carga de los datos al Data
86
Mart por medio de un Job, la generación de reportes y vistas de análisis de
manera remota al servidor de Pentaho, la conexión de los clientes al servidor, etc.
Cuadro N° 3
Pruebas Realizadas al proyecto
Actividad Pruebas Observaciones
Prueba del Job Se verifica que los datos
se cargan de forma
rápida.
S/N
Prueba de los ETL Se verifica que las tablas
dimensionales y de
hechos consten en el
Data Mart .
S/N
Inicializar el servidor de
Pentaho BI
Observar la correcta
inicialización de los
servicios del servidor de
Pentaho BI
Es preferible verificar
que esté instalado de
manera correcta el Java
Pruebas de publicación
de los cubos
multidimensionales.
Se verifica si los cubos
se han publicado de
manera correcta al
servidor de Pentaho BI
S/N
Inicializar plugin Saiku
Analitics para el
análisis.
Verificar que esta
aplicación se cargue de
manera correcta
Se escojo este plugin
por ser el más factible y
actualizado
Realizar verificación de
conexión entre cliente
servidor
Que los clientes puedan
entrar al servidor desde
otra PC al servidor para
hacer consultas
S/N
Realizar diferentes
pruebas de análisis con
los cubos con Saiku.
Se verifica de manera
local y remota que es
S/N
87
factible obtener
consultas.
Exportar las consultas Se guardan las consultas
en formato PDF, JPPG o
Excel
Depende de los
requerimientos de los
usuarios.
Fuente: Pruebas hechas al proceso
Elaborador por: Vicente Abel Granja Cevallos
Criterios de aceptación del Producto o Servicio
Se ha demostrado que con pocos recursos informáticos es viable implementar
este proyecto que será de ayuda a las autoridades del Consejo Nacional Electoral
medir la aceptación y uso del portal web de capacitación acerca del código de la
democracia por medio de la toma de decisiones utilizando la plataforma Pentaho
BI. De acuerdo a las especificaciones de la organización el proyecto cumple a
cabalidad los requisitos técnicos y también legales sobre el empleo de software
open source haciendo factible para usarlo en cualquier área de negocios de las
empresas públicas o privadas que deseen emplearlo.
Mediante un cuadro se define qué criterios son válidos por los diferentes
especialistas:
Cuadro N°4
Validación de la propuesta
Actividades Validación
Estudiar lo que la línea de negocios
en la toma de decisiones
estratégicas.
Poco satisfactorio
Conocer los requerimientos para
desarrollar el proyecto mediante
encuestas a los usuarios de la
organización.
Muy satisfactorio
Estudiar que software se usara
para implementar inteligencia de
Satisfactorio
88
negocios si se va a usar una
comercial o una open source
Determinar la fuente de datos si es
una base de datos o archivos para
iniciar el proceso.
Sastifactorio
Establecer cuáles son los costos
del proyecto.
Muy satisfactorio
Indicar en que área se usará esta
herramienta.
Sastifactorio
Realizar diferente pruebas al
sistema de inteligencia de
negocios.
Muy satisfactorio
Hacer las capacitaciones a los
usuarios que la usaran y
suministrarle un manual de usuario.
Sastifactorio
Fuente: Validaciones hechas al proceso
Elaborador por: Vicente Abel Granja Cevallos
89
CONCLUSIONES Y RECOMENDACIONES
CONCLUSIONES
Para implementar una solución de inteligencia de negocios es necesario
entrevistar a los usuarios los requerimientos para establecer qué información
desean consultar a la hora de diseñar diferentes tipos de reportes dinámicos que
permitan una correcta toma de decisiones estratégicas acerca de un área
específica de negocio que se desee medir en el momento indicado.
Se debe establecer con que base de datos transaccional se trabaja en la solución
de inteligencia de negocios, siendo esta fase importante para saber los elementos
que la conforman que son sus diferentes tablas, tipo de datos, los atributos, los
campos que contienen y como están interconectadas para poder realizar el diseño
de un Data Mart, aparte saber que motor de base de datos se empleó para su
diseño.
Por lo general el esquema en estrella es el que tienen la estructura más sencilla a
la hora de diseñar un Data Mart a partir de la información de la base de datos
transaccional ya que su diseño cuenta solo con una tabla de hechos que contiene
las medidas para el análisis y varias tablas dimensionales, ya que si llegan nuevos
requerimientos es posible modificar su estructura haciéndola muy flexible a los
cambios.
La estructura de un cubo multidimensional depende de la construcción
satisfactoria del Data Mart, porque si no relacionan de manera correcta las
diferentes tablas que la conforman especialmente la tabla de hechos que
contendrá las claves primarias de las diferentes tablas dimensionales o los
requerimientos que se han especificada no son los correctos al llegar a realizar
una consulta saldrá información errónea.
Para poder diseñar las vistas de análisis sobre un cubo multidimensional y también
poder navegarlas es necesaria que la plataforma tenga instalado un visualizador
OLAP potente, que entre sus características principales es poder mostrar los
90
resultados en tiempo real mediante el empleo de gráficos estadísticos en alta
resolución, aparte también que la información requerida pueda extraerse en
formato PDF o en una hoja en Excel.
91
RECOMENDACIONES
Se debe hacer una recolección específica de los requerimientos necesarios a
diferentes usuarios siendo principalmente los gerentes o directores de una
organización a los que se los entrevista y de esta manera entender que
información desean consultar cuando quieran realizar la toma de decisiones
estratégicas de un área de negocios, de eso depende una correcta
implementación de inteligencia de negocios.
Es recomendable que el origen de la información provenga de una base de datos
transaccional, de preferencia que el motor sea de Mysql ya que puede integrarse
a muchas herramientas informáticas que sirvan para implementar la inteligencia
de negocios y diferentes sistemas operativos, aparte que muestra de manera
gráfica como están conformados sus elementos como por ejemplo la unión entre
la diferentes tablas, que tipo campos tienen, sus claves primaria o las foráneas.
Los especialistas aconsejan usar el esquema en estrella porque puede
modificarse fácilmente si llegan a haber cambios a última hora en los
requerimientos propuestos por los usuarios a la hora de construir un, ya que una
característica principal es solo poseer una tabla de hechos y varias dimensionales,
que permitirán el diseño eficiente de varios cubos multidimensionales necesarios.
Es preferible que los requerimientos propuestos por los usuarios sean específicos
para no hacer cambios en la estructura de los cubos muldimensionales en último
momento que puedan afectar su rendimiento a la hora de realizar una consulta,
porque pueda llegar el caso de que solo presente información errónea que no
cumpla con las expectativas propuestas por la organización.
Los expertos recomiendan usar el visualizador de cubos OLAP Saiku Analitics
porque viene tanto en Open Source o por medio de una licencia comercial
Enterprise y además porque siempre está en constante desarrollo en relación con
otras herramientas que están en desuso como Jpivot por su difícil manejo a la hora
de arrastrar los diferentes elementos como son las dimensiones o atributos aparte
de que no permite la exportación a Excel
BIBLIOGRAFÍA
LIBROS
TRUJILLO, J. C., MAZON LOPEZ, J. N. Y PARDILLO VELA, J. (2013). Diseño y
explotación de almacenes de datos, Alicante
LOPEZ HERRERA, J. (2011). Programación en tiempo real y bases de datos,
Barcelona
LAUDON, K. C. Y LAUDON, J. P. (2004). Sistemas de información gerencial,
México
CARLOS CORONEL. (2011). Bases de Datos, Diseño, Implementación y
Administración, México
CALLE GUGLIERI, J. A. (1996). Reingeniería y seguridad en el ciberespacio,
Madrid
PEREZ, M. (2011). SQL Server 2008 R2 . San Fernando de Henares, Madrid
GUARDIA OLMOS, J. Y PERO, M. ().Esquemas de estadística , Barcelona
VIVANCO, M. (2005). Muestreo Estadistico. Diseño Y Aplicaciones, Santiago,
Chile
GRANDE ESTEBAN, I. Y ABASCAL FERNÁNDEZ, E. (2005). Análisis de
encuestas, Madrid
CURTO DÍAZ, J. Y CONESA CARALT, J. (2010). Introducción al Business
Intelligence, Barcelona
CASTERS, M., BOUMAN, R. Y VAN DONGEN, J. (2010). Pentaho Kettle
solutions, Indianápolis
DALFOVO, O., SELIG, P. M. Y BASTOS, R. C. (2007).Business Intelligence ,
Florianópolis
MICHAEL MCLAUGHLIN. (2013), MySQL Workbench: Data Modeling &
Development, new york
PÁGINAS WEB
SearchDataCenter en Español.(2016). ¿QUÉ ES BASE DE DATOS
RELACIONAL? DEFINICIÓN EN WHATIS.COM.
Disponible en http://searchdatacenter.techtarget.com/es/definicion/Base-de-
datos-relacional
Sinnexus.com (2016). DATAMINING (MINERÍA DE DATOS).
Disponible en: http://www.sinnexus.com/business_intelligence/datamining.aspx
Definición ABC (2016). DEFINICIÓN DE DATAWAREHOUSE
Disponible en: http://www.definicionabc.com/tecnologia/datawarehouse.php
Msdn.microsoft.com (2016). DATA SOURCES
Disponible en: https://msdn.microsoft.com/en-us/library/ms711688(v=vs.85).aspx
USER, S. (2016). ¿Qué es Inteligencia de Negocios?
Disponible en: http://onegolive.com/es/faq/inteligencia-de-negocios/que-es
Gnu.org, (2016). LICENCIAS - PROYECTO GNU - FREE SOFTWARE
FOUNDATION
Disponible desde: https://www.gnu.org/licenses/licenses.es.
Kettlenyc.com, (2016) KETTLE
Disponilble desde: https://kettlenyc.com/ [Accessed 20 Aug. 2016].
Pentaho, (2016). Pentaho
Disponible en: http://community.pentaho.com/projects/data-
integration/http://community.pentaho.com/projects/data-integration/
Mondrian.pentaho.com. (2016) PENTAHO MONDRIAN DOCUMENTATION
Disponible desde : http://mondrian.pentaho.com/documentation/olap.php
Sinnexus.com, (2016). BASES DE DATOS OLTP Y OLAP
Disponible desde:
http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
Opensource.org, (2016). NEWS | OPEN SOURCE INITIATIVE
Disponible desde: https://opensource.org/ [Accessed 20 Aug. 2016].
Business Intelligence, Data Warehouse. (2014). PENTAHO
Disponible desde: http://gravitar.biz/pentaho/.
SearchOracle, (2016). DATA SOURCES: WHAT, HOW AND WHY
Dsiponible desde: http://searchoracle.techtarget.com/news/918695/Data-sources-
What-how-and-why
ANEXOS
ANEXO A
ENCUESTA REALIZADA A LOS PROFESIONALES ESPERTOS EN
INTELIGENCIA DE NEGOCIOS
1.- ¿Ha escuchado sobre lo que es inteligencia de negocios?
• Si
• No
2.- ¿Conoce usted que herramientas de inteligencia de negocios existen
actualmente?
• Si
• No
3.- ¿Conoce alguna Plataforma de inteligencia de negocios: Comercial
(Licenciadas) u Open Source (Gratis)?
• Si
• No
4.-En caso de administrar su propia empresa ¿Cuál de estas opciones
Implementaría Comercial u Open Source?
• Comercial
• Open Source
5.- En caso de administrar su propia empresa ¿Por qué razones no
implementaría BI?
• Falta de recursos monetarios
• No necesita implementarlos
6.- ¿Conoce de alguna empresa que brinde soluciones de Inteligencia de
Negocio?
• Si
• No
7.- ¿Cuán importante considera aplicar soluciones de Inteligencia de
negocios para tomar decisiones?
• Muy Importante
• Importante
• Poco importante
• Sin importancia
8.- ¿Qué áreas importantes considera que deben ser analizadas en una
solución de inteligencia de negocios?
• Optimización de costos
• Control financiero
• Análisis de perfiles de clientes
• Planificación de la producción
• Rentabilidad de un producto en concreto
9.- ¿Qué tiempo usted invertiría en generar reportes gerenciales?
• 0 – 2 horas
• 3 – 4 horas
• 5 – 8 horas
• Más de 8 horas
10.- ¿Cuánto seria su inversión en implementar Inteligencia de Negocios?
• 0 – 500 dólares
• 500 – 1500 dólares
• 1500 – 2000 dólares
• Más de 2000 dólares
ANEXO B
Instalación y configuración de Pentaho Data Integration versión
Community Edition
Descarga de la aplicación
1.- Primero se abre el explorador de internet en este caso Google Chrome
2.- luego se pone en el buscador Descargar Pentaho Data Integration
3.- Ahora se busca la carpeta que dice Data Integration
4.- Luego se escoge la versión más actualizada que es del 2016
5.- Se escoge la versión más descargada y donde se puede observar que es la
también pesada
6.- Luego se presiona y después empieza la descarga de la aplicación.
7.- Luego se procede a buscarla en la carpeta descargas y después
descomprimirla ahí mismo
5.- Como se observa ya está descomprimida la aplicación listo para usarse ya que
es portable.
Conectarse a la base de datos en Pentaho Data Integration
1.- Primeros se busca la carpeta que tiene la aplicación y en donde se la ha
ubicado con el resto de aplicaciones
2.- Se busca la carpeta lib y se la abre y se copian los driver de Mysql para poder
establecer la conexión.
3.- Luego se abre la aplicación en donde se busca el archivo spoon y se presiona.
4.- Para conectarse como ejemplo en una transformación para definir como es la
conexión y verificar si está en línea con la base de datos
5.- Se ubica el curso en File New y se escoge Data Base Connection
6.- Aquí se abre un panel de configuración de la conexión que vamos a hacer en
este caso se utilizara el motor de base de datos Mysql.
7.- Luego se definen los parámetros para conectarse, escogiendo primero la base
de datos que es Mysql. Luego se llena lo siguiente:
• Nombre de la Coeneccion: Transacional
• Host Name: Localhost si eslocal y si es en red una ip ejemplo 192.168.0.3
• Numero de puerto: 3306 por defecto
• Usuario: Root
• Password: 1234
8.- Se pone en test y sale la verificación que está correcta la conexión y luego
Ok, ahora se procede a realizar cualquier actividad como definir los ETL por
ejemplo.
Creación de un ETL
1.- Se procede a ir al menú File luego se escoge New y luego Transformation
2.- Luego se escoge los elementos con los que se va a trabajar en este caso se
escoge el elemento Table input ubicado en Elementos de entrada o Input. Que
permitirá la carga de los datos que se va a transformar.
3.- Luego se escoge el elemento output que permitirá la parte de cargar la
información en una tabla del modelo dimensional. Y luego se procede a unir
ambos elementos o producir un salto.
4.- e esta fase procede a configurar la entrada en donde se le podrá el nombre
que se requiera y también la conexión a la base.
5.- Aquí se puede ver la configuración de la base de datos de la entrada
6.- Con el código en SQL se puede observar la información que se desea pasar
al modelo dimensional poniendo preview y luego se pone Ok.
7.- en la salida se procede a configurar el nombre de ña salida, la conexión a la
base de datos dimensional y el esquema o tabla especifica en donde se va a
cargar la base de datos.
8.- Aquí se muestra la conexión a la base datos de la salida
9.- Ahora se procede a ejecutar este ETL poniendo el cursor en la parte arriba
que es la barra de herramientas en donde hay unos botones en uno esos esta
run se lo presiona y luego se ve como se ejecuta la transformación y como se
puede observar han sido transferidos como 73 registros de una base de datos a
otra.
ANEXO C
Código fuente de las tablas dimensionales
Los códigos fuentes fueron hechos en lenguaje SQL para poder construir las
diferentes tablas dimensionales y son los siguientes:
Usuario
select cu.id ,concat(cu.apellidos," ",cu.nombres) as
Nom_Completos,cu.cedula,cu.usuario_correo,cu.genero,cu.edad,
cp.nombre as Provincia,cc.nombre as Canton,cpr.nombre as Parroquia
From cne_usuarios cu
inner join cne_provincias cp on cu.id_provincia = cp.id
inner join cne_canton cc on cu.id_canton = cc.id
inner join cne_parroquia cpr on cu.id_parroquia=cpr.id
order by cu.id; Copia_usuarios select cu.id ,concat(cu.apellidos," ",cu.nombres) as
Nom_Completos,cu.genero,cu.edad,cu.discapacidad
From cne_usuarios cu
where concat(cu.apellidos," ",cu.nombres) is not null
order by cu.id;
Tiempo_logueo select id_usuario,
bita.fecha_registro AS Fecha_Registro,
substring(fecha_registro from 12) as Tiempo,
hour(fecha_registro) as Hora,
year(bita.fecha_registro) AS Anio,
month(bita.fecha_registro) AS Mes,
monthname(bita.fecha_registro) as NombreM,
Day(bita.fecha_registro) AS Dia,
dayname(bita.fecha_registro) AS NombreD
From abc_democracia.cne_bitacora_logueo bita
group by id_usuario,bita.fecha_registro
order by id_usuario,bita.fecha_registro; Tiempo_Registro select cu.id,
cu.fecha_registro AS Fecha_Registro,
substring(cu.fecha_registro from 12) as Tiempo,
hour(cu.fecha_registro) as Hora,
year(cu.fecha_registro) AS Anio,
month(cu.fecha_registro) AS Mes,
monthname(cu.fecha_registro) as NombreM,
Day(cu.fecha_registro) AS Dia,
dayname(cu.fecha_registro) AS NombreD
From cne_usuarios cu
group by cu.id,cu.fecha_registro
order by cu.id,cu.fecha_registro; Provincias
SELECT id,nombre,codSuper
FROM abc_democracia.cne_provincias
order by nombre; Cantón SELECT id_provincia,id,nombre,cn_codsup FROM abc_democracia.cne_canton
order by nombre; Parroquias SELECT id_provincia,id_canton,id,nombre,cn_codsup FROM
abc_democracia.cne_parroquia
order by nombre; Genero SELECT * FROM abc_democracia.cne_genero; Raza SELECT id,descripcion FROM abc_democracia.cne_autoidentificacion; Sector SELECT * FROM abc_democracia.cne_sector_residencia; Edad SELECT 'NIÑEZ' RANGO_EDAD ,a.edad FROM abc_democracia.cne_usuarios a where
a.edad between 6 and 12 group by a.edad
union all
SELECT 'ADOLESCENTES' RANGO_EDAD ,a.edad FROM abc_democracia.cne_usuarios
a where a.edad between 13 and 17 group by a.edad
union all
SELECT 'ADULTOS JOVENES' RANGO_EDAD ,a.edad FROM
abc_democracia.cne_usuarios a where a.edad between 18 and 35 group by
a.edad
union all
SELECT 'ADULTOS' RANGO_EDAD ,a.edad FROM abc_democracia.cne_usuarios a
where a.edad between 36 and 64 group by a.edad
union all
SELECT 'ADULTOS MAYORES' RANGO_EDAD ,a.edad FROM
abc_democracia.cne_usuarios a where a.edad > 64 group by a.edad;
Cartilla SELECT
id
, descripcion
FROM cne_cartilla
Hora
SELECT 'MADRUGADA' RANGO_HORA,fecha_registro ,hour(fecha_registro) as Hora
FROM cne_bitacora_logueo
where hour(fecha_registro) between 0 and 5 group by Hora,fecha_registro
union all
SELECT 'MAÑANA' RANGO_HORA,fecha_registro,hour(fecha_registro) as Hora
FROM cne_bitacora_logueo
where hour(fecha_registro) between 6 and 11 group by Hora,fecha_registro
union all
SELECT 'TARDE' RANGO_HORA,fecha_registro,hour(fecha_registro) as Hora FROM
cne_bitacora_logueo
where hour(fecha_registro) between 12 and 18 group by Hora,fecha_registro
union all
SELECT 'NOCHE' RANGO_HORA,fecha_registro,hour(fecha_registro) as Hora FROM
cne_bitacora_logueo
where hour(fecha_registro) between 19 and 23 group by Hora,fecha_registro; Rango
SELECT 'NOTA 10' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=10 group by cant_respuestas
union all
SELECT 'NOTA 9' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=9 group by cant_respuestas
union all
SELECT 'NOTA 8' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=8 group by cant_respuestas
union all
SELECT 'NOTA 7' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=7 group by cant_respuestas
union all
SELECT 'NOTA 6' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=6 group by cant_respuestas
union all
SELECT 'NOTA 5' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=5 group by cant_respuestas
union all
SELECT 'NOTA 4' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=4 group by cant_respuestas
union all
SELECT 'NOTA 3' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=3 group by cant_respuestas
union all
SELECT 'NOTA 2' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=2 group by cant_respuestas
union all
SELECT 'NOTA 1' RANGO_NOTA,cct.cant_respuestas FROM
cne_cartillas_terminadas cct inner join cne_cartilla cc on
cct.id_cartilla=cc.id
where cant_respuestas=1 group by cant_respuestas;
Discapacidad
select distinct discapacidad
from cne_usuarios
where discapacidad is not null; Genero SELECT
id
, descripcion
FROM cne_genero
Como se puede observar las sentencias muestran los elementos que conforman
cada una de la tablas de son parte del Data Mart.
Código fuente de las tablas de hechos
Estos son los códigos fuentes de las tablas de hechos realizados en lengua SQL
en donde se pueden observar los diferentes elementos que las conforman y son
los siguientes
Hechos Usuarios
select du.id_usuario as Usuario,dre.id_d_rango as
RangoEdades,dtr.id_tiempor as Fecha,au.Registros
from aux_usuario au
inner join d_usuarios du on au.id_usuario= du.id_user
inner join d_rangoedades dre on du.Edad=dre.edad
inner join d_tiempo_r dtr on du.id_user = dtr.id_usuario
group by du.id_user; Hechos Cultura
select da.id_d_raza as Raza ,dsr.id_d_sector as Sector,dg.id_d_genero as
Genero ,acu.registros
From aux_cultura acu
inner join d_autoidentificacion da on acu.id_raza=da.id_raza
inner join d_sectorr dsr on acu.id_sector=dsr.id_sector
inner join d_genero dg on acu.id_genero=dg.id_genero
group by Raza,Sector,Genero
order by Raza,Sector,Genero; Hechos Localidades
select dp.id_d_prov as Provincia,dc.id_d_can as Canton,dpr.id_d_par as
Parroquia,
dg.id_d_genero_l as Genero,dd.id_d_discapacidad as Discapacidad,
al.registros
From aux_localidades al
inner join d_provincia dp on al.id_provincia = dp.id_provincia
inner join d_canton dc on al.id_canton = dc.id_canton
inner join d_parroquia dpr on al.id_parroquia=dpr.id_Parroquia
inner join d_genero_l dg on al.id_genero = dg.id_genero
inner join d_discapacidad dd on al.id_discapacidad = dd.condicion
group by provincia,canton,parroquia,genero,discapacidad
order by provincia,canton,parroquia,genero,discapacidad; Hechos Cartillas select dc.id_d_cartillas,drc.id_d_RanC,ac.registros as
Personas_Registradas
from aux_calificacion ac
inner join d_cartillas dc on dc.id_cartilla =ac.id_cartilla
inner join d_rangocalificacion drc on ac.id_rango=drc.Nota;