universidad de guayaquil facultad de ...repositorio.ug.edu.ec/bitstream/redug/47016/1/tesis...1.4.3...

128
UNIVERSIDAD DE GUAYAQUIL FACULTAD DE INGENIERÍA INDUSTRIAL CARRERA DE LICENCIATURA EN SISTEMAS DE INFORMACIÓN TRABAJO DE TITULACIÓN PREVIO A LA OBTENCIÓN DEL TÍTULO DE LICENCIADO EN SISTEMAS DE INFORMACIÓN ÁREA DESARROLLO DE SOFTWARE TEMA IMPLEMENTACIÓN DE UN ALMACÉN DE IMÁGENES DIGITALES UTILIZANDO UNA BASE DE DATOS NOSQL QUE PERMITA A LA EMPRESA GENERALI ECUADOR CIA. DE SEGURO S.A. GUARDAR DOCUMENTOS DE SUS CLIENTESAUTOR CELLERI GAVILÁNEZ PETER OMAR DIRECTOR DEL TRABAJO LSI. LINO CASTILLO KATTY NANCY, MSI GUAYAQUIL, OCTUBRE 2019

Upload: others

Post on 08-Jul-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE INGENIERÍA INDUSTRIAL CARRERA DE LICENCIATURA EN SISTEMAS DE

INFORMACIÓN

TRABAJO DE TITULACIÓN

PREVIO A LA OBTENCIÓN DEL TÍTULO DE

LICENCIADO EN SISTEMAS DE INFORMACIÓN

ÁREA

DESARROLLO DE SOFTWARE

TEMA

“IMPLEMENTACIÓN DE UN ALMACÉN DE IMÁGENES

DIGITALES UTILIZANDO UNA BASE DE DATOS NOSQL

QUE PERMITA A LA EMPRESA GENERALI ECUADOR

CIA. DE SEGURO S.A. GUARDAR DOCUMENTOS DE SUS

CLIENTES”

AUTOR

CELLERI GAVILÁNEZ PETER OMAR

DIRECTOR DEL TRABAJO

LSI. LINO CASTILLO KATTY NANCY, MSI

GUAYAQUIL, OCTUBRE 2019

Page 2: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

ii

Page 3: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

iii

Page 4: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

iv

Dedicatoria

Dedico mi trabajo de titulación a mi hija principalmente, que a pesar de todos los

obstáculos que se han presentado siempre ha estado alentándome a seguir adelante, que

junto a mis padres son mi principal fuente motivación.

A todos los docentes que he tenido a lo largo de mi vida que gracias a ellos he podido

llegar hasta este día.

Page 5: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

v

Agradecimiento

En primer lugar y sobre todo agradezco a Dios quien ha sido el que me ha dado la

sabiduría y perseverancia para poder llegar hasta este punto de mi vida, mi familia quien

siempre ha estado junto a mí en todo momento, docentes de la facultad y autoridades de la

universidad de Guayaquil.

Page 6: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

vi

Índice general

No Descripción Pág

PRÓLOGO 1

INTRODUCCIÓN 2

CAPÍTULO I

MARCO TEÓRICO

No Descripción Pág

1.1 La importancia de la información de los clientes en las empresas de seguro. 10

1.1.1 Las compañías de seguros y el lavado de activos. 11

1.2 La digitalización de documentos como alternativa de almacenamiento. 14

1.2.1 Almacenamiento de información en archivos 14

1.2.2 La Digitalización de documentos 16

1.2.3 Sistemas informáticos documentales 17

1.3 Almacenamiento centralizado de documentos digitales en las empresas. 19

1.3.1 Las TIC en la centralización de información 20

1.3.2 Caso: Implementación de una base de datos de imágenes de facturas 22

1.4 Las alternativas de bases de datos NoSQL como solución viable. 22

1.4.1 Problemas de las bases de datos relacionales 22

1.4.2 Tecnologías emergentes 23

1.4.3 Sistemas de bases de datos distribuidas 23

1.4.4 Sistemas de almacenamiento Not Only SQL 24

1.4.5 Base de datos clave-valor 26

1.4.6 Base de datos orientada a documentos 27

1.4.7 Base de datos NoSQL couchDB 29

1.4.8 Caso: Sistema de gestión de expedientes de los estudiantes de la carrera de

ingeniería de sistemas computacionales 30

1.4.9 ¿Migrar o complementar? 31

1.5 Marco Conceptual 32

1.5.1 Base de datos 32

1.5.2 Datos 33

1.5.3 Rendimiento de las bases de datos 33

Page 7: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

vii

1.5.4 Sistema Administrador de Base de Datos 33

1.5.5 Usuarios de un sistema de base de datos 34

1.5.6 Las transacciones 34

1.5.7 Propiedades ACID 34

1.5.8 Bases de datos estructuradas o relacionales 35

1.5.9 Modelo Jerárquico 35

1.5.10 Modelo de red 35

1.5.11 Modelo relacional 35

1.5.12 Orientadas a objetos 36

1.5.13 Teorema CAP 36

1.5.13.1 Consistencia 38

1.5.13.2 Disponibilidad 38

1.5.13.3 Tolerancia a particiones 39

1.5.14 Propiedades BASE 39

1.5.15 Google File System y MapReduce 40

1.5.16 Protocolo TCP/IP 41

1.5.17 Protocolo HTTP 41

1.5.18 Servidor Web 41

1.5.19 PHP (Hypertext Preprocessor) 42

1.5.20 JSON (JavaScript Object Notation) 42

1.5.21 CURL 42

1.5.22 Servicio web REST (Representational State Transfer) 43

1.5.23 SoapUI 43

1.5.24 Proyecto fauxton 43

1.5.25 Diagramas 43

1.5.25.1 Diagrama de caso de uso 44

1.5.25.2 Diagrama de flujo de datos de contexto 44

1.5.25.3 Diagrama de despliegue 44

1.5.26 Metodología de desarrollo de software 45

1.5.26.1 Metodologías Tradicionales 45

1.5.26.2 Metodologías ágiles 46

1.5.26.3 SCRUM 47

1.5.26.4 RAD 48

Page 8: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

viii

1.5.26.5 Fases de RAD 48

1.5.26.6 Metodologías de desarrollo en implementación de bases de datos 49

1.5.27 Prueba de software 49

1.5.27.1 Tipos de pruebas 50

1.5.27.2 Método de Caja Negra 50

CAPÍTULO II

METODOLOGÍA

No Descripción Pág

2.1 Tipo de investigación 51

2.2 Alcance de la investigación 52

2.3 Técnicas de recolección de datos 53

2.3.1 Técnica de observación 54

2.3.1.1 Aplicación de la observación 54

2.3.2 Técnica de la entrevista 55

2.3.2.1 Aplicación de entrevistas 55

2.3.2.2 Resumen de las entrevistas para especificaciones funcionales 56

2.3.2.3 Matriz de resumen de entrevistas 57

2.3.3 Recopilación documental 59

2.3.3.1 Búsqueda de cliente. 59

2.3.3.2 Grupo de documentos 60

2.3.3.3 Pantalla de ingreso de documentos 61

2.3.3.4 Pantalla de eliminación y descarga de documentos 62

2.3.3.5 Formato de registro de novedades de respaldo de base de datos 64

2.3.3.6 Reporte estadístico elaborado en Excel 64

2.3.3.7 Notificación sobre problemas en el proceso de respaldos 65

2.3.3.8 Análisis documental 66

2.4 Arquitectura 66

2.5 Metodología de desarrollo 67

2.6 Identificación del problema 67

2.7 Especificaciones funcionales 69

2.7.1 Requerimientos funcionales 69

2.7.2 Requerimientos no funcionales 69

Page 9: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

ix

2.8 Casos de uso 69

2.8.1 Definición de actores de casos de uso y listado de roles 70

2.8.2 Diagramas de casos de uso 70

2.8.2.1 Diagramas de casos de uso de mantenimiento de documentos 70

2.8.2.2 Descripción de casos de uso 71

2.8.2.3 Descripciones de casos de uso de insertar documento 71

2.8.2.4 Descripciones de casos de uso de descargar documento 72

2.8.2.5 Descripciones de casos de uso de eliminar documentos 73

2.9 Diagrama de flujo de datos de contexto 73

2.10 Diagrama de despliegue 74

CAPÍTULO III

PROPUESTA

No Descripción Pág

3.1 Introducción 75

3.1.1 Tema 75

3.1.2 Objetivo 75

3.1.3 Entorno de software 75

3.2 Fase de diseño 75

3.2.1 Modelo entidad – relación 75

3.2.2 Diagrama de actividades 77

3.2.3 Diccionario de la base de datos – MySql 80

3.2.3.1 Diccionario de la tabla de documentos 80

3.2.3.2 Diccionario de la tabla de cliente 82

3.2.3.3 Diccionario de la tabla grupo de documentos del cliente 84

3.2.3.4 Diccionario de la tabla imágenes del documento 86

3.2.4 Diccionario de la base de datos – CouchDB 88

3.2.4.1 Diccionario de documento JSON documentos 88

3.3 Pruebas 90

3.3.1 Casos de prueba 91

3.3.1.1 Caso de prueba conexión a la base de datos mediante servicio web REST 91

3.3.1.2 Caso de prueba de insertar documento 92

3.3.1.3 Caso de prueba de descargar documento 93

Page 10: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

x

3.3.1.4 Caso de prueba de eliminar documento 94

3.3.2 Pruebas con SoapUI 95

3.3.3 Prueba de integración con el sistema SIDD 97

3.3.3.1 Ingreso de archivo 97

3.3.3.2 Descargar archivo desde el sistema SIDD 99

3.3.3.3 Eliminar documentos desde el sistema SIDD 101

3.4 Conclusión y recomendación 102

3.4.1 Conclusiones 102

3.4.2 Recomendaciones 103

ANEXOS 105

BIBLIOGRAFÍA 109

Page 11: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

xi

Índice de tablas

No Descripción Pág

1 Resumen de problemas detectados en el personal de cumplimiento 68

2 Resumen de problemas detectados en el departamento de IT 68

3 Requerimientos funcionales 69

4 Requerimientos no funcionales 69

5 Lista de roles 70

Page 12: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

xii

Índice de figuras

No Descripción Pág

1 Ubicación geográfica de la empresa Generali Ecuador Cía. De Seguros S.A 4

2 Fotografía del servidor de Generali Ecuador 6

3 Beneficios de los sistemas de gestión documental 18

4 Almacenamiento clave-valor 27

5 Almacenamiento de colección de documento 28

6 Comparación de base de datos NoSQL 29

8 Imagen de un sistema de base de datos 32

9 Representación de una tabla en el modelo relacional 36

10 Representación gráfica del teorema CAP 38

11 Representación gráfica del proceso mapreduce 41

12 Representación de una estructura JSON 42

13 Uso de librería curl con lenguaje de programación PHP 43

14 Ejemplo de diagrama de despliegue 44

15 Clasificación de metodologías de desarrollo 45

16 Comparación de metodologías ágiles y tradicionales 46

17 Representación de las fases de la metodología SCRUM 47

18 Fases de la metodología RAD 48

19 Formulario de búsqueda de cliente 60

20 Formulario de grupo de documentos 61

21 Formulario de ingreso de nuevos documentos 62

22 Formulario de consulta de documentos 63

23 Descarga o eliminación de documentos 63

24 Formato de registro de ejecución de respaldos 64

25 Reporte estadístico del proceso de respaldos 64

26 Notificación de problemas en la base de datos de MySql. 65

27 Arquitectura de couchDB 66

28 Etapas del presente proyecto basado en la metodología RAD 67

29 Diagrama de casos de uso de interacción con el sistema 70

30 Diagrama de flujo de datos de contexto 74

31 Diagrama de despliegue, se presenta gráficamente la estructura y la distribución

de los componentes entre los diferentes componentes que integran el proceso. 74

Page 13: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

xiii

32 Diagrama de modelo de datos MySql 76

33 Diagrama de actividad de descarga de documento 77

34 Diagrama de actividad de ingresar documentos 78

35 Diagrama de actividad de eliminar documento 79

36 Diccionario de la tabla de documentos 80

37 Diccionario de la tabla de clientes 82

38 Diccionario de la tabla grupo de documentos del cliente 84

39 Diccionario de la tabla imágenes del documento 86

40 Estructura de documento JSON documentos 88

41 Conexión a la base de datos mediante servicio web REST 95

42 Insertar datos mediante servicio web REST 95

43 Consultar datos mediante servicio web REST 96

44 Eliminar datos mediante servicio web REST 96

45 Contenido de documento JSON 98

46 Descarga de archivo desde el sistema SIDD 100

47 Eliminar documento desde el sistema SIDD 102

Page 14: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

xiv

Índice de anexos

No Descripción Pág

1 ENTREVISTAS 106

Page 15: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

xv

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE INGENIERÍA INDUSTRIAL

CARRERA LICENCIATURA EN SISTEMAS DE INFORMACIÓN

UNIDAD DE TITULACIÓN

“IMPLEMENTACIÓN DE UN ALMACÉN DE IMÁGENES

DIGITALES UTILIZANDO UNA BASE DE DATOS NOSQL QUE

PERMITA A LA EMPRESA GENERALI ECUADOR CIA. DE

SEGURO S.A. GUARDAR DOCUMENTOS DE SUS CLIENTES”

Author: Peter Celleri Gavilánez

Tutor: Eng. Kattty Lino Castillo, Msig.

Resumen

La finalidad del presente proyecto se implementó un almacén de documentos digitalizados

de los clientes de la empresa Generali Ecuador Cía. de Seguros S.A., mediante el uso de

base de datos NoSQL las cual también permitió centralizar dicha información. Que

mediante un análisis se determinó que la actual base de datos no soportar la carga operativa

que representa almacenar los archivos digitalizados. Así como también se observó que

algunas de estos documentos se encontraban disperso en otros sistemas de la compañía.

Con esta nueva base de datos lograremos mejorar la búsqueda de los documentos de

clientes, así como también mejoraremos los procesos administrativos relacionado con la

base de datos.

Palabras claves: Implementar, Almacenar, Centralizar, Base de datos, NoSQL,

documentos digitalizados.

Page 16: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

xvi

UNIVERSIDAD DE GUAYAQUIL

FACULTAD DE INGENIERÍA INDUSTRIAL

CARRERA LICENCIATURA EN SISTEMAS DE INFORMACIÓN

UNIDAD DE TITULACIÓN

“IMPLEMENTATION OF A STORE OF DIGITAL IMAGES USING

A NOSQL DATABASE THAT ALLOWS THE COMPANY

GENERALI ECUADOR CIA. DE SEGURO S.A. TO SAVE

DOCUMENTS FROM ITS CUSTOMERS”

Author: Peter Celleri Gavilánez

Tutor: Eng. Kattty Lino Castillo, Msig.

Abstract

The proposal of the present project is to implement a store of digitized documents for the

clients of the company Generali Ecuador Cía. de Seguros S.A., through the use of the

NoSQL database, which can also centralize this information. And through an analysis it

was determined that the currently database does not support the operational load

represented by the scanned files. And also it was observed that some of these documents

were dispersed in other systems of the company. With this new database, it will be able to

improve the search for customer documents, as to well as to improve the administrative

processes related to the database.

Key words: implement, centralization, Storage, Data base, NoSQL, Digital documents.

Page 17: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

PRÓLOGO

El objetivo del presente trabajo de titulación inicialmente fue pensando para adquirir un

mayor conocimiento sobre las bases de datos no estructuradas y que el presente documento

sirva como guía para personas que no tienen los conocimientos necesarios para

implementar un proyecto con este tipo de bases de datos.

Este proyecto está estructurado en 3 capítulos, los cuales están detallados a

continuación:

Capítulo 1: Elaboración del marco teórico, se investiga, compara y analiza las bases de

datos que se implementará dentro del presente trabajo de titulación.

Capítulo 2: Descripción de la metodología, se realiza el levantamiento de información

de acuerdo a las técnicas utilizadas para la investigación, elaboración de caso de uso y

diagramas.

Capítulo 3: La propuesta de la investigación en la cual se detalla el proceso de la

solución propuesta, complementando con las conclusiones y recomendaciones del estudio

realizado.

Page 18: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

INTRODUCCIÓN

Tema

Implementación de un almacén de imágenes digitales utilizando una base de datos

NoSQL que permita a la empresa Generali Ecuador Cía. de Seguro S.A. guardar

documentos de sus clientes.

Introducción

Objeto de estudio

El presente proyecto tendrá como objeto de investigación el proceso de almacenamiento

y centralización de documentos digitalizados de los clientes de la empresa Generali

Ecuador Cía. De Seguros S.A.

Antecedentes

Generali Ecuador Cía. de Seguros S.A. es una empresa del sector asegurador

domiciliada en Ecuador, pero que es propiedad de un Holding internacional conocido

como GRUPO GENERALI; Generali Ecuador cuenta con una participación de 4,2% del

mercado de seguros dentro del país.

Por la política interna “Conozca a su cliente” de la normativa vigente del GRUPO

GENERALI para Generali Ecuador es de gran importancia almacenar copia digitalizada de

los documentos legales de sus clientes, inspecciones riesgos asegurados o siniestros

incurridos. El no cumplimiento de esta normativa puede llevar a sanciones económicas por

parte del GRUPO GENERALI e incluso la separación del cargo a las personas que la

incumplan.

Actualmente la empresa cuenta con un sistema denominado SIDD (Sistema Integrado

de Digitalización de Documentos), que mediante una interfaz web permite seleccionar un

archivo electrónico y almacenarlo en una base de datos.

El sistema SIDD es una aplicación informática que se utiliza para guardar algunos de

los documentos de los clientes tales como: copia de cédula, papeleta de votación, planilla

de servicios básicos, entre otros documentos.

El sistema SIDD no se usa para almacenar toda la documentación de los clientes ya que

existen documentos que son generados por otros sistemas de la empresa tales como las

facturas electrónicas, pólizas electrónicas, informes de inspección, informes de siniestros,

formularios de vinculación de clientes, entre otros documentos.

Page 19: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 3

Alcance

El alcance del presente proyecto de titulación busca mejorar el proceso de

almacenamiento de documentos digitales implementando una base de datos NoSQL que

permita centralizar los documentos del cliente, minimizando el impacto por las

modificaciones realizadas en los actuales sistemas de la empresa Generali Ecuador Cía. De

Seguros.

Para este proyecto se plantea un piloto en donde la nueva base de datos documental se

integre con el actual proceso de almacenamiento de documentos, almacenando la

información desde el momento de la implementación del mismo. En el presente proyecto

no se considera una migración de datos de la base de datos MySql a la base de datos

couchDB.

Fundamento de la investigación

El presente proyecto de tesis con el apoyo tecnológico permitirá solucionar los

problemas que suscitan en la empresa Generali Ecuador Compañía de Seguros S.A. con

relación al almacenamiento disperso de los documentos digitales de sus clientes.

Por qué del tema

Se seleccionó este tema por el interés que representa conocer las prestaciones que

brindan las bases de datos no estructuradas frente a este tipo de proyectos y por medio de

este trabajo de tesis compartir la solución propuesta.

Por otra parte, en el ámbito profesional como analista programador, la implementación

de este proyecto aportará en gran medida para adquirir conocimientos de mucho valor

relacionados al uso de base de datos no estructuradas.

Orígenes teóricos

En el marco de la teoría informática, el presente tema se desarrolló mediante una serie

de entrevistas realizadas a varios usuarios de los diferentes procesos relacionados con la

generación y almacenamiento documentos digitalizados de los clientes de la empresa

Generali Ecuador Cía. de Seguros S.A.

Las entrevistas se realizaron a usuarios claves dentro del proceso de registro de

documentación digitalizada de los clientes, estos usuarios son quienes utilizan o

Page 20: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 4

administran los sistemas informáticos de la empresa y se ven afectado directamente por la

ausencia de una base de datos que permita la óptima manipulación de dichos documentos.

Objeto de la investigación

Delimitación espacial

El presente proyecto se realizará en la empresa Generali Ecuador Cía. de Seguros S.A la

cual ofrece sus servicios a nivel nacional, pero cuya agencia principal se encuentra

domiciliada en el cantón Guayaquil de la provincia del Guayas del Ecuador.

Figura 1. Ubicación geográfica de la empresa Generali Ecuador Cía. De Seguros S.A., información

adaptada de https://www.google.com/maps (2019)

Delimitación del tema

Este proyecto plantea determinar la situación actual de cómo se lleva a cabo el proceso

de almacenamiento de la información digitalizada de los clientes en la empresa Generali

Ecuador Cía. de Seguros S.A., ayudando a agilizar los procesos relacionados al

almacenamiento de esta información.

Page 21: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 5

Para el desarrollo de esta propuesta, se implementará una base de datos no estructurada

para el registro y consulta de documentos digitalizados.

El proyecto concibe desarrollar un modelo que respalde la autonomía del almacén de

datos y la integridad de las mismas mediante la implementación de servicios web como

capa de acceso a datos. Esto es posible debido a que couchDB tiene integrado un API

REST el cual se utiliza para interactuar con la base de datos mediante peticiones HTTP

usando los métodos GET, POST, PUT y DELETE.

Este proyecto no pretende desarrollar un programa que permita automatizar la

digitalización de documentos, sino crear un base de datos documental que permita

almacenar los documentos digitalizados de clientes.

Delimitación semántica

Un documento digital por así decirlo hace referencia a una fotocopia electrónica de un

documento físico, el cual se puede almacenar en una computadora. Estos documentos

digitales tienen muchas ventajas frente a los documentos físicos, entre las cuales podemos

señalar que los documentos digitales son prácticamente indestructibles, son fácilmente

duplicables y que no ocupan un espacio físico como archivadores, etc.

Por otra parte, la centralización de documentos se podría explicar como el lograr ubicar

en un mismo lugar documentos que provienen desde diferentes orígenes. Esto supone una

gran mejora en la administración de los documentos al reducir los lugares de búsqueda y el

tiempo que se ocupa en dicha tarea.

Determinación de recursos

La empresa Generali Ecuador Cía. de Seguros S.A. cuenta con el departamento de

sistemas el cual administra los recursos de informáticos de la empresa, así mismo cuenta

con el departamento de cumplimiento el cual controla la ejecución de las políticas del

GRUPO GENERALI. Ambos departamentos facilitaron los siguientes recursos:

Recursos humano

Rodrigo Pazos Ortiz, Ingeniero de sistemas, Administrador del centro de cómputo.

John Navarrete Zuñiga, Tecnólogo de sistemas, Desarrollador.

Johan Beltran, Ejecutivo de cumplimiento.

Page 22: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 6

Recursos tecnológicos

Recursos de software

Apache couchDB, base de datos NoSQL, versión 2.3.1

MySql, base de datos relacional, versión 5.5.16

Servidor web apache, versión 2.0

PHP, lenguaje de programación web, versión 5.5.6

Sublime text, editor de texto para código fuente, versión 3.2.1

Recursos de Hardware

Ordenador de escritorio Lenovo thinkcentre con procesador Intel core i5 2.90 GHz,

8GB de memoria RAM y disco duro SSD de 500GB

Servidor IBM x3650 M4 con procesador Intel Xeon E5-2600 v2 de 12 núcleos, 32GB

de memoria RAM, 1TB de disco duro SAS en RAID 5

Figura 2. Fotografía del servidor de Generali Ecuador, Servidor IBM X3650 M4, por el autor (2019)

Planteamiento del problema

Debido al crecimiento de Generali en el mercado de seguros del país, el número de

clientes está aumentando significativamente lo que implica que cada vez es mayor el

volumen de documentos electrónicos que se tiene que almacenar.

Muchos de estos documentos se encuentran almacenados en diferentes servidores por el

motivo que son archivos generados por varias aplicaciones que tiene la empresa para

manejar su operación diaria, lo que ocasiona que los usuarios deban buscar los documentos

del cliente en diferentes lugares.

Page 23: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 7

Aunque la empresa cuenta con un Sistema Integrado de Digitalización de Documentos

(SIDD) este sistema se utiliza únicamente para guardar copia de los documentos legales de

los clientes como copia de cédula, papeleta de votación, etc. documentos que por

normativa de la empresa tienen que ser actualizados anualmente.

Esta condición ha generado alto consumo de los recursos del servidor en donde se

encuentra alojado el sistema SIDD, como efecto de la carga operacional que recibe

actualmente el motor de base de datos los discos duros han sufrido daños por el uso

excesivo a causa de la lectura y escritura de información.

Cada vez son más frecuentes las quejas de los usuarios que operan el sistema SIDD

debido a la considerable disminución del rendimiento de las operaciones de consultas,

inserción y actualización de documentos, proceso que cada vez toma más tiempo

completar. También cabe mencionar el aumento de la complejidad en las tareas

administrativas de la base de datos del sistema SIDD como son la ejecución de respaldos y

la restauración de los mismos; sacar una copia de la base de datos tarda aproximadamente

8 horas y 13 horas restaurar un respaldo, tiempo que aumenta progresivamente con el pasar

de los días, causando problemas al administrador de la base de datos al no contar con el

tiempo para realizar dichas tareas.

Justificación de la investigación

Implementar una base de datos que tenga mejores prestaciones ayudará a soportar la

carga operacional que implica almacenar los documentos digitalizados de los clientes de la

empresa.

También permitirá aumentar el rendimiento del Sistema Integrado de Digitalización de

Documentos (SIDD) haciendo que los usuarios se sientan más satisfechos al momento de

utilizarlo en sus labores diarias.

El sistema SIDD también tendrá la posibilidad almacenar archivos con otros formatos

como PDF, ZIP, documentos de Word, Excel, etc. y no únicamente imágenes como

actualmente lo hace.

Para minimizar el impacto de modificación en el sistema SIDD de la empresa, se

implementarán servicios web REST como interfaz de acceso a datos a la base de datos;

eliminando las colas de conexión desde el aplicativo, permitiendo mayor fluidez en la

ejecución de sentencias de lectura y escritura de datos.

Page 24: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 8

Relevancia social

Este proyecto impactará a dos grupos de usuarios dentro de la empresa, los cuales

describimos a continuación:

Los ejecutivos de cumplimientos, que son los usuarios encargados de velar que

la documentación de los clientes se encuentre actualizada. Al mantener la

información en solo lugar se les hará más fácil realizar sus tareas.

Los administradores de base de datos, que son los encargados de administrar y

mantener en funcionamiento las bases de datos de la empresa, que podrán

realizar tareas administrativas de manera más ágil y oportuna.

Pertinencia

La implementación de este proyecto permitirá que los ejecutivos de cumplimientos

puedan desarrollar sus labores de una manera más eficiente al ejecutar la política “Conozca

a su cliente” del GRUPO GENERALI. Debido a que en la actualidad los ejecutivos de

cumplimiento para indagar sobre un cliente en particular tienen que buscar la

documentación en diferentes sistemas.

Page 25: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Introducción 9

Objetivos

Objetivo General

Implementar una base de datos NoSQL que almacene y centralice los documentos

digitalizados de los clientes de la empresa Generali Ecuador Cía. de Seguros S.A., que

permita al departamento de cumplimiento realizar sus labores de manera más eficiente.

Objetivos Específicos

1. Recopilar información necesaria para determinar la problemática relacionada con los

procesos de la gestión de documental de los clientes.

2. Analizar la información recabada.

3. Diseñar la estructura de la base de datos y las operaciones de lectura y escritura de los

datos.

4. Implementar servicios web como interfaz de acceso a la base de datos, que

reemplazaran la capa de acceso a datos del Sistema Integrado de Digitalización de

Documentos (SIDD).

5. Gestionar procesos de pruebas funcionales que permitan evidenciar el correcto

funcionamiento de la base de datos. y su integración con el sistema SIDD

Page 26: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

CAPÍTULO I

MARCO TEÓRICO

1.1 La importancia de la información de los clientes en las empresas de seguro.

(Cevallos, J. R. M., & Holguín, B. L. D., 2018) dice que:

La creciente globalización, el proceso de internacionalización de la

empresa, el incremento de la competencia en los mercados de bienes y

servicios, la rapidez en el desarrollo de las tecnologías de información, el

aumento de la incertidumbre en el entorno y la reducción de los ciclos de

vida de los productos originan que la información se convierta en un

elemento clave para la gestión, así como para la supervivencia y

crecimiento de la organización empresarial. (Cevallos, J. R. M., &

Holguín, B. L. D., 2018)

Este concepto describe el vertiginoso camino que actualmente recorren las empresas,

indiferente del tipo que esta sea. El mercado al que apuntan cada vez es más competitivo,

más fraccionado (como es el caso de las empresas nacionales que tiene que competir con

las grandes empresas transnacionales), Para contrarrestar estos eventos las empresas deben

usar la información de la mejor manera posible para evolucionar táctica y

tecnológicamente con el objetivo de alcanzar un mejor nivel competitivo que les permita

aumentar sus ganancias. La optimización de procesos es una parte fundamental de la

transformación empresarial en especial de los procesos que tienen un impacto directo al

cliente.

(Sánchez, A., 2007) dice que:

Para una empresa es clave del éxito el conocer y dirigirse a los “Grupos

Claves” de clientes para satisfacerlos a través de los procesos adecuados

que contribuyan a tal fin, adaptando a los mismos los recursos y toda la

organización. Por ello, toda empresa debe de empezar por diferenciar a

sus clientes (y a los clientes de la competencia a los que quiera dirigirse),

distinguiendo a aquellos que son “claves” para el modelo de negocio que

haya definido. Además, deberá de agrupar a los clientes en función de

criterios que le permita tratarlos con diferentes estrategias, adecuándose

Page 27: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 11

mejor a sus necesidades para así poder ofrecérselas. Esto le podrá crear

una ventaja competitiva frente a la competencia. (Sánchez, A., 2007)

Según lo descrito por Sanchez A. se puede entender que las empresas deben centrar sus

esfuerzos en los clientes, obtener información de ellos, conocer sus preferencias. Contando

con esta información y un análisis minucioso de la misma, las empresas podrán crear

productos y servicios adaptados a las necesidades de los clientes. Todo este proceso

permitirá a las empresas tener la oportunidad de mantenerse pionero del mercado y lograr

los objetivos comerciales.

1.1.1 Las compañías de seguros y el lavado de activos.

Antes de hablar de las compañías de seguros, primero se debe de conocer el concepto de

“riesgo”, el cual es un concepto fundamental para este tipo de compañías.

(Legislación sobre contrato del seguro, 1963, Art. 4) dice que:

Denominase riesgo el suceso incierto que no depende exclusivamente

de la voluntad del solicitante, asegurado o beneficiario, ni de la del

asegurador y cuyo acaecimiento hace exigible la obligación del

asegurador. Los hechos ciertos, salvo la muerte, y los físicamente

imposibles no constituyen riesgo y son, por tanto, extraños al

contrato de seguro. (Legislación sobre contrato del seguro, 1963)

Por lo que se puede entender un riesgo es un peligro, es la posibilidad de que un evento

suceda y se cause un perjuicio para la persona dueña del objeto en riesgo. Este objeto

puede ser un bien material como son las casas, carros, etc. o puede también ser intangible

como la salud o la vida. Cuando un riego es materializado se denomina siniestro.

Otro concepto de riesgo es que él que publica una de las grandes aseguradoras

internacionales en su portal de educación financiera y de seguros.

(Fundación Mapfre, 2019) dice que:

Desde un punto de vista general, puede también entenderse como

una «actividad económica-financiera que presta el servicio de

transformación de los riesgos de diversa naturaleza a que están

sometidos los patrimonios, en un gasto periódico presupuestable, que

Page 28: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 12

puede ser soportado fácilmente por cada unidad patrimonial».

(Fundación Mapfre, 2019)

El concepto anterior amplía un poco más el conocimiento sobre los riesgos y su relación

con las empresas de seguros, con lo cual se entiende que, si una persona u organización

contrata los servicios de una empresa de seguros, en palabras generales lo que está

haciendo es intercambiar un riesgo por un gasto.

(Larrea Ayala, L., 2003) dice que:

Uno de los mecanismos que la inteligencia humana encontró para

minimizar el impacto económico que la ocurrencia de los hechos y

actos referidos anteriormente ocasionan, fue la transferencia del

riesgo, la misma que dio origen a lo que ahora conocemos como

“Institución del Seguro” y cuya aplicación ha permitido que las

sociedades puedan mantener vigentes sus objetivos superiores.

(Larrea Ayala, L., 2003)

Los riesgos son la razón de la existencia de las empresas de seguros, el giro del negocio

de una aseguradora es vender contratos de seguros o pólizas de seguros, las cuales son

utilizadas por los clientes para mitigar las pérdidas económicas en consecuencia de un

siniestro. Es decir, si un cliente compra una póliza de seguros, en el momento que ocurra

un siniestro la empresa de seguros tendrá cubrir con los gastos de la reposición de dicha

pérdida

La UAFE dice que: “El lavado de activos es el proceso a través del cual los bienes de

origen delictivo se integran al sistema económico financiero legal aparentando haber

sido obtenidos de forma lícita”. UAFE (2019)

Las fuentes más comunes de bienes ilícitos son el tráfico de drogas, personas y armas, el

secuestro, fraude fiscal, peculado, enriquecimiento ilícito, etc.

Estos bienes al no tener una procedencia legal pueden ser embargado o retenidos por los

entes de control y es por esta razón que las organizaciones delictivas “lavan” los bienes

para luego hacer uso de los mismos como en comprar: casas, carros, viajar o forman

empresas legalmente constituida o simplemente depositar el dinero en bancos.

Page 29: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 13

(Andrade, J., 2009) dice que:

En algunas ocasiones, con la posible complicidad del agente de

seguros, el lavador asegura los bienes por un valor superior al real

(supraseguro); igualmente, asegura bienes inexistentes; o asegura

bienes existentes, pero, de alguna manera, relacionados con

actividades ilícitas, que luego son siniestrados… El delincuente

recibe por parte de la aseguradora dinero lícito, en algunos casos por

devolución y en otros por compensación, al mismo tiempo logra

deshacerse de bienes obtenidos en actividades criminales. De esta

manera tratara de justificar el origen de su dinero en el pago de

pólizas de seguros. (Andrade, J., 2009)

Las compañías de seguros desde hace mucho tiempo han sido objetivos de mafias

organizadas dedicadas al lavado de dinero. Que mediante compra de pólizas de seguros

intenta ocultar bienes de origen ilícito. Para minimizar este riesgo el GRUPO GENERALI

ha implementado una política denominada “conozca a su cliente” la cual guarda en

archivos electrónicos copia de los documentos legales de los clientes previo a la venta de

un seguro, la documentación posteriormente será sometida a análisis por los ejecutivos de

la compañía.

(Generali Ecuador Cía. de Seguros, 2019) dice que:

La identificación del cliente implica el conocimiento y revisión de los

datos proporcionados por el cliente, persona natural o jurídica, al

momento de la vinculación, durante el transcurso de la relación y al

momento de la renovación de la relación contractual, ya sea en la

suscripción de pólizas, al realizar pagos relacionados con el contrato

del seguro o reaseguro o al proporcionar cualquier otro servicio.

(Generali Ecuador Cía. de Seguros, 2019)

Para las compañías de seguros no solo es necesario tener un simple registro de clientes,

sino que es imprescindible contar con un registro ampliado de clientes, es decir la empresa

debe saber el estado financiero del cliente, el origen de sus ingresos e incluso su estado de

salud. Además de tener que solicitar copia de documentos legales como cédula de

identidad, actas de constitución en caso de ser una empresa, planilla de servicios básicos,

Page 30: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 14

etc. Esta información tendrá una vigencia y deberá ser pedida al momento de renovar el

contrato de seguros o cuando se realicen pago a causas de siniestros.

(Casares, I. S. A. B. E. L., 2013) dice que:

Las empresas deberían contar con una infraestructura adecuada

para soportar el sistema de evaluación y gestión de riesgos, en

función de las características, tamaño y complejidad de las

operaciones de la empresa, por lo que se debería dotar de recursos

humanos y tecnológicos que sean necesarios para la administración

de los riesgos. (Casares, I. S. A. B. E. L., 2013)

El párrafo anterior explica que existe mucha información de los clientes que las

empresas de seguros deben almacenar. Por lo cual Casares indica que es imprescindible

contar con un proceso archivístico que permita albergar toda esta información, para que

posteriormente pueda ser consultada y ser sometida a procesos de evaluación y

clasificación de riesgos. Esto es importante debido a que la información del cliente siempre

estará disponible y será sometida a escrutinio cuando sea necesario, como es el caso de

revisiones periódicas por renovación de contratos o auditorías internas y externas. Pero

sobre todo el análisis de estos documentos con técnicas previamente establecidas por la

compañía permite detectar índices de fraude o lavado de activos. De esta manera se mitiga

los riesgos y se evitan perjuicios económicos para la empresa de seguro o sanciones

judiciales como la suspensión de las actividades comerciales.

1.2 La digitalización de documentos como alternativa de almacenamiento.

1.2.1 Almacenamiento de información en archivos

(Fugueras, R. A., 2003) dice que:

Los archivos también son las instituciones responsables de velar por

esta documentación, así como el espacio físico donde se conserva

adecuadamente para garantizar su accesibilidad, preservación y uso.

(Fugueras, R. A., 2003)

El archivo como tal es una entidad que puede ser física o abstracta cuyo objetivo

principal es la conservación de la información plasmada en los documentos y que se

Page 31: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 15

encarga de organización y almacenamiento de los mismos, para que de tal manera puedan

ser asequibles para ser consultados.

Antes de los sistemas de información, contar con un archivo era una buena opción para

almacenar los documentos de los clientes, pues con el archivo se soluciona el problema de

guardar y consultar la copia de los documentos de los clientes. Pero también conlleva otros

problemas propios de este método de almacenamiento como son: Ocupación de un espacio

físico para el alojamiento de los documentos, acceso limitado a los documentos, desgaste y

fragilidad de los documentos, gastos de mantención, etc.

(Urbina, G. B., 2016) dice que:

Hoy día, la información no se protege y preserva sólo para que no

sea dañada, sino por la importancia y el uso que ésta tiene en todos

los ámbitos de la vida. El comercio internacional, las instituciones

bancarias y todo tipo de empresas mantienen sus operaciones gracias

a que la información fluye a través de todos sus departamentos y

áreas. La información se utiliza en cualquier empresa para realizar

cuatro tipos de operaciones: planeación, dirección, organización y

control. (Urbina, G. B., 2016)

Las organizaciones deben velar por la seguridad de cada documento que ingresa a sus

librerías y asegurar su permanencia durante el tiempo que sean requeridos, es por eso que

las empresas constantemente deben implementar nuevos métodos de almacenamiento de

documentos que permitan incrementar tanto el almacenamiento como la seguridad de la

información de forma eficiente en vías de mejorar la calidad del contenido.

(Sánchez, A. E., 2014) dice que:

Las innovaciones de proceso incluyen también las nuevas o

mejoradas técnicas, equipos y programas informáticos utilizados en

las actividades auxiliares de apoyo. (Sánchez, A. E., 2014)

Para lograr un mayor índice de competitividad en el actual mercado las empresas deben

mejorar sus procesos, a todo nivel desde los procesos misionales o mandatorios hasta los

procesos de apoyo, en especial aquellos procesos que generan conocimiento, los que

permiten tomar decisiones de forma más ágil y oportuna.

Page 32: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 16

1.2.2 La Digitalización de documentos

(Mesa, E. G., 2006), dice que:

La digitalización es la captura de una imagen física, mediante

escáner o cámara digital, que una vez convertida en imagen

electrónica puede ser almacenada y procesada por una

computadora. (Mesa, E. G., 2006)

De acuerdo al enunciado anterior la digitalización de documentos es el proceso

informático que se emplea para crear una réplica electrónica de un documento físico. El

producto final de este proceso es un archivo electrónico el cual seguramente será guardado

dentro de los discos duros en los servidores de la compañía para luego ser consultado por

los empleados de la misma. Núñez Quiroz, J. J. en el 2019 indica que existen algunas

razones por las que una empresa puede iniciar un proyecto de digitalización documental,

las cuales son:

Incrementar el acceso: Un proyecto de digitalización permite incrementar el acceso a

los documentos por parte de los usuarios, es decir los documentos podrán ser

consultados o compartidos por varios usuarios al mismo tiempo y de igual manera un

mismo usuario podrá acceder a varios documentos en un periodo muy corto de tiempo

lo que le permitirá rápidamente obtener nuevos conocimientos que le servirán para

tomar decisiones.

Mejorar los servicios: Este punto guarda una estrecha relación con el punto anterior,

debido a que incrementar el acceso a los documentos proporciona una mejora en la

calidad de los servicios ofrecidos a los usuarios al reducir el tiempo de espera por parte

del usuario que solicita un documento.

Reducir la manipulación: Con la digitalización se evita la manipulación de papeles,

carpetas, archivadores, etc. Además, se reduce el desgaste de los documentos originales

y se evita sacar fotocopias de los mismos.

(Mesa, E. G., 2015), dice que:

La digitalización no sólo es un método económico, dinámico y fiel en

la preservación y/o conservación de la información y sus

documentos, sino también es una herramienta que bien utilizada

permite la restauración y reconstrucción de la información

contenida, adquiriendo de esta forma un valor agregado y

Page 33: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 17

propiciando un sistema de gestión documental mediante el cual la

información se estructurará de forma fácil, rápida y cómoda para el

usuario o cliente. (Mesa, E. G., 2015)

Como se puede observar, Mesa aporta otro beneficio de la digitalización de

documentos, el cual consiste en que tener la información digitalizada nos permite crear

nuevo conocimiento de manera más rápida, esto es debido a que se puede relacionar los

documentos y su contenido de forma ágil. Pero así mismo Mesa indica que para ello se

necesita un sistema informático con interfaz de usuario que permita gestionar los

documentos de manera amigable y eficiente de acuerdo a las necesidades de la empresa y

el usuario, estos sistemas se denominan “Sistemas de Gestión Documental”.

(García-Canal, E., Rialp-Criado, A., & Rialp-Criado, J., 2015) dice que:

“a través de la disponibilidad de una mayor y mejor información,

obtenida de forma más rápida y económica, permite aumentar la

eficiencia administrativa tanto de los procesos internos como la

gestión de las relaciones con clientes y proveedores” (García-Canal,

E., Rialp-Criado, A., & Rialp-Criado, J., 2015)

Mejorar el proceso de almacenamiento de la documentación de los clientes con un

esquema de digitalización de documentos es una opción viable, especialmente cuando los

documentos son el origen de información que resulta valiosa para la organización, como es

el caso de los documentos de los clientes de las empresas de seguros. En la práctica, el

poder acceder a los documentos de manera más fluida permitirá a los ejecutivos de la

compañía ejecutar de manera más eficiente el proceso de revisión periódica de dichos

documentos.

1.2.3 Sistemas informáticos documentales

Tic. Portal (2016) dice que: “Beneficios de los sistemas documentales, reducción de

costes gracias a información estructurada, mejor porcentaje en documentos y aumento de

la velocidad de creación de contenidos”. Tic. Portal (2016)

Implementar un sistema documental posee muchos beneficios con relación a los

métodos de archivos convencionales, entre los cuales se puede nombrar la reducción de

Page 34: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 18

espacio físico que se utiliza para guardar los documentos, reducción de costos de

mantenimiento de dicho espacio físico, entro otros.

Figura 3. Beneficios de los sistemas de gestión documental, información tomada de https://www.ticportal.es/

(2016)

También se aumenta considerablemente la capacidad almacenamiento ya que los

documentos se guardan en ficheros electrónicos. Adicionalmente los sistemas

documentales permiten procesar simultáneamente diferentes documentos de varias fuentes,

lo que se traduce en un aumento del rendimiento en la gestión de documentos.

(Sánchez-Vignau, B. S., & Valdés-López, Y., 2008) dice que:

En un Sistema de Información Documental, por tanto, la recuperación de

información esta relacionada con la representación del conocimiento registrado

en documentos, con la representación de las necesidades de información de los

usuarios del sistema y con el desarrollo de una función capaz de comparar

ambas, así como seleccionar los documentos más relevantes para solucionar la

necesidad de información. (Sánchez-Vignau, B. S., & Valdés-López, Y., 2008)

Almacenar, conservar y distribuir información son las funciones principales de los

sistemas informáticos documentales, la información contendía en los documentos se

relaciona entre sí para generar nuevo conocimiento, el cual tiene como finalidad ser

utilizado para resolver problemas de la organización.

(Ley General de Seguros, 2014, Art. 29) dice que:

Las empresas de seguros están obligadas a conservar los duplicados de las

pólizas expedidas y sus anexos, por lo menos hasta tres años después de la fecha

de su vencimiento, excepto las pólizas de seguro marítimo que se conservarán

por lo menos seis años. (Ley General de Seguros, 2014)

Page 35: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 19

El artículo 29 de la ley general de seguros obliga que durante un periodo no menor a

tres años las aseguradoras deben mantener en sus archivos la documentación vinculada a la

emisión de las pólizas de seguro. Este periodo inicia luego del fin de la vigencia de la

póliza, es decir las empresas de seguros en promedio deberán tener a la mano los

documentos de los clientes durante cuatro años.

La viabilidad de implementar la digitalización como método de almacenamiento de

documentos es un compendio de características, beneficios y necesidades que se

interrelacionan para en base a la tecnología informática solucionar determinados problemas

del mercado.

1.3 Almacenamiento centralizado de documentos digitales en las empresas.

(Solleiro, 2017) dice que:

La gestión tecnológica es, en resumen, un campo interdisciplinario

en que se mezclan conocimientos de ingeniería, ciencia y

administración con el fin de realizar la planeación, el desarrollo y la

implementación de soluciones tecnológicas que contribuyan al logro

los objetivos estratégicos y tácticas de una organización. (Solleiro,

2017)

En la actualidad las empresas consideran a la tecnología no solo como una herramienta

que puedes utilizar para alcanzar sus objetivos, sino más bien, como uno de los pilares

estratégicos en que se basan dichos objetivos. Debido a que la tecnología resuelve muchos

de los problemas operativos que tienen las empresas.

Así mismo la gestión informática permite detectar degradación en los procesos de las

diferentes funciones administrativas, cuando se identifica una función que afecte de forma

negativa a la operación de la empresa, es importante rediseñar los procesos tal como se

describe a continuación.

(PERUGACHI, P., & PAÚL, S., 2017) dice que:

Al hablar de reingeniería, se relaciona con la innovación de procesos.

Así, dichos procesos se modernizan y permiten a la empresa ser más

eficiente, por lo cual la reingeniería busca repensar las estructuras

administrativas para organizarlas en procesos o unidades de

Page 36: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 20

negocios, así, se reemplaza la segmentación de funciones.

(PERUGACHI, P., & PAÚL, S., 2017)

La reingeniería permite que las empresas puedan optimizar recursos mediante el

mejoramiento de sus procesos, además se puede lograr una reestructuración empresarial en

donde los esfuerzos de la organización se encuentren encaminados a lograr los objetivos de

la empresa. La reingeniería también tiene que ver con la innovación organizacional

mediante la implementación de tecnologías que logren la sistematización de los procesos

para que ayuden a una mejor administración de la información y por consiguiente una

mejor toma de decisiones.

(Silva, Berrú, Jhenino Felipe, and Pablo Andrés Chicaiza Ayala., 2006) dice que:

Mediante la consolidación del almacenamiento, se consigue una

utilización del almacenamiento bastante alta, generalmente el

incremento es de 10 a 20 % comparado al modelo de conexión

directa, lo cual implica un ahorro de varios cientos de GB (Giga

Bytes) de almacenamiento. (Silva, Berrú, Jhenino Felipe, and Pablo

Andrés Chicaiza Ayala., 2006)

La referencia anterior menciona que aplicar una centralización en el almacenamiento de

la información permite optimizar los recursos en lo que a hardware se refiere, en este caso

se explica que reduce el uso de espacio en disco hasta un 20%. El ahorro de recursos

permite extender la vida útil de los discos duros y por consiguiente reduce los costos de

mantenimiento.

1.3.1 Las TIC en la centralización de información

(García-Canal, E., Rialp-Criado, A., & Rialp-Criado, J., 2015) dice que:

La inversión en TIC ha permitido pasar de un sistema de información

originalmente muy descentralizado, donde cada planta disponía de un

sistema de información local, a un sistema más centralizado que

permite reducir el coste de mantenimiento de las aplicaciones y

Page 37: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 21

aprovechar soluciones identificadas localmente. (García-Canal, E.,

Rialp-Criado, A., & Rialp-Criado, J., 2015)

En el contexto documental, la aplicación de las TIC también permite reducir costos al

pasar de un sistema de almacenamiento de archivos descentralizado a uno centralizado. El

tener varios sistemas de almacenamiento de archivo implica que se debe adecuar esos

sistemas para cumplir dicha tarea, esto representa un costo adicional cuando se podría tener

un solo sistema que almacene todos los archivos de los diferentes sistemas. La cual que se

reduce considerablemente el tiempo de búsqueda de un archivo al tener que buscar en un

solo sistema.

Chaverra, J. A. H., & Arias, A. V., 2017) aporta su concepto sobre las TIC en los

procesos documentales:

Estas extienden los procesos de memoria de la compañía, entendidos

como la consolidación de bases de datos con información histórica,

información actualizada y no duplicada, con lo que además ayudan a

optimizar costos de mantenimiento de información y capacidad de

archivo. (Chaverra, J. A. H., & Arias, A. V., 2017)

La implementación de las TIC en los procesos documentales de las organizaciones

incrementa en gran medida la capacidad de almacenar información con un alto estándar de

calidad, evitando información duplicada o desactualizada, las TIC fomentan la distribución

de información fiable por todas las áreas de la organización ayudando que estas se alineen

con los objetivos de la empresa.

(Tic. Portal, 2016) dice que:

La cantidad de canales a través de los que la información llega a las

empresas es amplia. A consecuencia de esto, grandes volúmenes de

información quedan desestructurados y repartidos entre los distintos

sistemas de una compañía. Un sistema de gestión documental

almacena y organiza toda la información proveniente del trabajo

diario de la empresa en una ubicación central. (Tic. Portal, 2016)

Page 38: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 22

Implantar un repositorio centralizado de documentos digitalizados en las

organizaciones, según las TIC, permitirá buscar más rápidamente los documentos

relacionados a un cliente, debido a que toda esta información reposa en un solo sitio.

1.3.2 Caso: Implementación de una base de datos de imágenes de facturas

Lodisal S.A. es una empresa ecuatoriana dedicada a la operación logística de producto

de consumo masivo, la cual en el 2006 implementó un repositorio centralizado de

imágenes digitalizadas de las facturas emitidas y guías de despacho de sus clientes. Este

proyecto se ejecutó con la finalidad de tener un soporte permanente y de fácil acceso a los

documentos para las conciliaciones del inventario, lo facturado y las auditorías por parte de

sus clientes. Cabe mencionar que el proyecto que se implementó de manera satisfactoria

logrando los resultados deseados, reduciendo costos de almacenamiento de documentos y

sobre todo la satisfacción por parte de los usuarios que ya no tenía que ir a las bodegas a

buscar las cajas con los documentos físicos.

Tic. Portal (2016) dice que: “Esta centralización de la información supone terminar con

la búsqueda infinita de documentos por las redes de carpetas de la organización agilizando,

de esta forma, el ritmo de trabajo”. Tic. Portal (2016)

Con la centralización se facilitarán otras tareas adicionales, tales como el control de

versiones de los documentos, respaldos de la información y gestión de contenido.

1.4 Las alternativas de bases de datos NoSQL como solución viable.

1.4.1 Problemas de las bases de datos relacionales

(Grolinger, Higashino, Tiwari, & Capretz, 2013) dice que:

Los sistemas de gestión de bases de datos relacionales fueron

diseñados en una era en la que el hardware disponible, al igual que

los requerimientos de almacenamiento y procesamiento eran muy

diferentes a los presentados en la actualidad. Por lo tanto, estas

soluciones han tenido bastantes retos en cuanto a los requerimientos

de rendimiento y escalamiento necesarios para Big Data. (Grolinger,

Higashino, Tiwari, & Capretz, 2013)

Como se indica en esta referencia las bases de datos relacionales fueron creadas para un

esquema de datos estructurados, datos relacionados unos con otros, esto es muy importarte

Page 39: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 23

para guardar la integridad referencial de los datos y las transacciones que se realizan con

ellos, pero este mismo principio transaccionalmente es muy costoso, haciendo que las

bases de datos relacionales no posean las características necesarias para manejar grandes

volúmenes de datos o por lo menos no sin tener que invertir en equipos especializados que

a la final terminan siendo muy caros y que además para implementarlos requieren mano de

obra especializada.

1.4.2 Tecnologías emergentes

(Almenara, 2007), explica que:

“… la implantación en la sociedad de las denominadas “nuevas

tecnologías” de la comunicación e información, esta produciendo

cambios insospechados respecto a los originados en su momento por

otras tecnologías, como fueron en su momento la imprenta, y la

electrónica.” (Almenara, 2007)

Las tecnologías emergentes son tecnologías que se han venido desarrollando con el fin

de reemplazar o complementar a las tecnologías tradicionales que actualmente son

plenamente aceptadas. Esto debido a la aparición de nuevas necesidades tecnológicas que

estas últimas no ha logrado cubrir.

Una de estas necesidades es el aumento del poder de cómputo que ha surgido con las

nuevas tendencias de almacenamiento de datos. Una tecnología que permite de

contrarrestar esta necesidad a un costo accesible para las empresas o personas es mediante

la implementación de sistemas de bases de datos distribuidas.

1.4.3 Sistemas de bases de datos distribuidas

(Date, C. J., 2001) dice que:

Un sistema de bases de datos distribuida consiste en una colección de

sitios, conectados por algún tipo de red, en el cual cada sitio es un

sistema de base de datos completo por derecho propio, pero los sitios

han acordado trabajar juntos, a fin de que un usuario de cualquier

sitio pueda acceder a los datos desde cualquier lugar de la red. (Date,

C. J., 2001)

Page 40: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 24

Entonces se puede entender que, en una base de datos distribuida los datos que se

depositen en ella se encuentran diseminados en diferentes nodos (cada nodo puede ser una

computadora o un servidor) de una misma red que se comunican internamente entre ellos,

de manera totalmente transparente para los usuarios ya que los datos pertenecen

lógicamente a un sistema único.

Entre las ventajas que se presentan al tener un sistema de base de datos distribuida se

puede describir las siguientes:

Alta disponibilidad, si un nodo deja de funcionar, es solo una parte de la red la que verá

afectada, mientras que el resto de nodos seguirá operando, es decir la base de datos

continuará procesando solicitudes.

La modularidad que tienen estas bases de datos permite adicionar o quitar nodos sin

afectar con las operaciones.

Mejor rendimiento debido a que las peticiones se distribuyen entre todos los nodos (a

esto se le denomina balanceo de carga), además los datos con mayor concurrencia se

almacenan más cerca del nodo que la solicita para mejorar los tiempos respuesta.

Reducción de costos ya que implementar una red de nodos con computadoras

ordinarias es más económico que tener un solo servidor muy poderoso.

Entre las desventajas de un sistema de base de datos distribuida podemos citar:

La implementación debe estar bien documentada debido a que cada nodo puede

presentar problemas únicos. De lo contrario existirá falta de estándares

La seguridad de la red de nodos es más compleja que cuando se trabaja con un solo

servidor.

Es diseño y el mantenimiento de la base de datos distribuida es más complejo que las

demás bases de datos que trabajan en un solo servidor.

1.4.4 Sistemas de almacenamiento Not Only SQL

NoSQL (No sólo SQL) este nombre hace referencia a aquellos sistemas de gestión de

bases de datos que, por lo general, no utiliza el lenguaje SQL para acceder, almacenar y

gestionar los datos.

(Martin, R., Manuel, H., & Ariza Quiroga, D. A., 2016) dice que:

Debido a la gran cantidad y al crecimiento acelerado de la

información de diversos tipos, estructurada, semi-estructurada y sin

Page 41: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 25

estructura, alrededor del mundo, fenómeno al cual se le conoce como

Big Data. Dada esta situación se presenta la necesidad de sistemas de

almacenamiento que puedan proveer un modelo fácilmente

programable y además que sean altamente escalables, con el fin de

poder soportar, procesar y almacenar de forma eficiente dicha

información. (Martin, R., Manuel, H., & Ariza Quiroga, D. A., 2016)

Las bases de datos NoSQL se caracterizan por no manejar una estructura de datos en

particular, es decir manejan un esquema de datos más flexible, a diferencia de las bases de

datos relacionales que imponen el uso de tablas y relaciones entre tablas, esto las hace que

las bases de datos NoSQL sean ideales para manejar grandes cantidades de datos. Además,

estas bases de datos pueden fácilmente aplicar computación distribuida lo que las hace

altamente escalable.

(Bases de Datos NoSQL en Cloud Computing, 2013) dice que:

Las bases NoSQL son adecuadas para una escalabilidad realmente

enorme, y tienden a utilizar modelos de consistencia relajados, no

garantizando la consistencia de los datos, con el fin de lograr una

mayor performance y disponibilidad. (Bases de Datos NoSQL en

Cloud Computing, 2013)

Las bases de datos NoSQL al igual que cualquier otro sistema de base de datos tienen

sus ventajas y desventajas, estas cualidades tienen que ser evaluadas de acuerdo al uso y

necesidad de cada proyecto. Como bien indica en texto anterior las bases NoSQL su uso

principal se aplicará cuando en un proyecto requiera trabajar con grandes volúmenes de

datos y que al mismo tiempo sea necesario mantener un óptimo rendimiento, pero que no

sea imprescindible la consistencia de los datos en el momento de un fallo.

Existen varios tipos de bases de datos NoSQL, están las se pueden instalar en un

servidor interno de la empresa como son: mongoDB, couchDB, Casandra, etc. y también

existes base de datos NoSQL que se pueden alquilar a manera de servicio como son:

DynamoDB y SimpleDB de amazon, BigTable de google o Cloudant de IBM la cual es un

servicio basado en una implementación de couchDB.

Page 42: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 26

(Couchbase, 2019) dice que:

La creación y ejecución de estas aplicaciones masivamente

interactivas ha creado un nuevo conjunto de requisitos tecnológicos.

La nueva arquitectura de tecnología empresarial debe ser mucho

más ágil que nunca y requiere un enfoque de gestión de datos en

tiempo real que pueda adaptarse a niveles sin precedentes de escala,

velocidad y variabilidad de datos. Las bases de datos relacionales no

pueden cumplir con estos nuevos requisitos y, por lo tanto, las

empresas están recurriendo a la tecnología de base de datos NoSQL.

(Couchbase, 2019)

Este tipo de base de datos es una tecnología emergente que busca una alternativa a las

bases de datos convencionales y poco a poco ha logrado ganarse espacio dentro de mundo

informático, en especial en la computación en la nube ya que en ellas priman conceptos

como: sistemas distribuidos, manejo de grandes volúmenes de datos, velocidad y alta

disponibilidad. Estos gracias a que dentro del concepto NoSQL convergen múltiples

tecnologías que son aplicadas para lograr un objetivo particular el cual dependerá de las

prestaciones que se requieran de la base de datos.

1.4.5 Base de datos clave-valor

(Moyano González, 2019) dice que:

Los sistemas de clave-valor prometen un rendimiento excelente para

volúmenes de datos muy grandes, a cambio de ser muy simples y

renunciar a funcionalidades que tenemos en otros sistemas como la

verificación intrínseca de la integridad de datos, llaves extranjeras y

disparadores. Las validaciones de los datos se delegan

completamente en la aplicación cliente, siendo la base de datos,

simplemente el lugar donde se guardan los datos. (Moyano González,

2019)

Las bases de datos clave-valor tiene características que permiten reemplazar a las bases

de datos relacionales en tareas donde se manipulan grandes volúmenes de datos, debido a

su muy superior desempeño de procesamiento, aunque para lograrlo han tenido que

Page 43: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 27

sacrificar otras características como la integridad referencial. Pero las ventajas y

desventajas que obtenidas por estas características dependerá expresamente del tipo de

proyecto al cual se las quiere implementar.

(Zhingri, V., & Augusto, C., 2016) dice que:

Este tipo de base de datos tiene el modelo de base de datos más

simple entre las base de datos NoSQL, por que los datos se

almacenan como un par clave-valor; la clave es asociada con un solo

elemento en la base de datos, lo cual permite la recuperación de la

información de forma muy rápida. (Zhingri, V., & Augusto, C., 2016)

Las bases de datos clave-valor guardan los datos en una colección de campos en donde

el título del campo es la clave y del otro lado está el dato almacenado que viene a ser el

valor. Las claves son únicas en la colección es decir no se pueden repetir dentro de una

misma colección. Entre la base de datos clave-valor más conocidas se encuentran: Riak,

Dynamo, Redis y Voldemort.

Figura 4. Almacenamiento clave-valor, información tomada de Bases de Datos NoSQL: Escalabilidad y alta

disponibilidad a través de patrones de diseño, por Antiñanco (2013)

1.4.6 Base de datos orientada a documentos

(Antaño, A. C. M., Castro, J. M. M., & Valencia, R. E. C., 2014) dice que:

Almacenan a información como si fueran documentos. Por lo general

utilizan formato JSON o XML. El funcionamiento es muy similar a

las clave-valor, sólo que en este caso el atributo clave es el nombre

que se le pone al fichero. (Antaño, A. C. M., Castro, J. M. M., &

Valencia, R. E. C., 2014)

Page 44: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 28

Las bases de datos documentales son la evolución natural de las bases de datos clave-

valor y fueron inspiradas en lotus notes, estas bases de datos fueron ideadas para manipular

y almacenar documentos, estos documentos son codificados en un formato estándar de

intercambio de datos como XML, JSON o BSON.

Figura 5. Almacenamiento de colección de documento, información tomada de Análisis de rendimiento entre

la base de datos relacional: MySQL y una base de datos no relacional: MongoDB, por Zhingri, V., &

Augusto, C., (2016)

Entre las bases de datos documentales más conocidas se puede nombrar a: simpleDB,

mongoDB y couchDB.

(Tran, M. C., & Nakamura, Y, 2016) dice que:

A excepción de algunas, estas bases de datos generalmente

proporcionan sus datos a través de HTTP, almacenan los datos como

documentos con la notación de objetos de JavaScript (JSON) y

ofrecen diferentes API para varios lenguajes. Los intereses generales

son la sencillez, velocidad y escalabilidad. (Tran, M. C., & Nakamura,

Y, 2016)

En el mercado existen bases de datos NoSQL que no permiten un acceso directo a los

datos por parte de los programas informáticos, para efecto de esto estas bases de datos

integran un servidor web que publica servicios web REST para transferir los datos vía

protocolo HTTP. La información viaja contenida en documento JSON el cual es un

formato liviano para transportar información. Esto permite en los aplicativos suprimir la

capa de acceso a datos y en su lugar se consume los servicios web publicado por la base de

datos.

Page 45: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 29

Figura 6. Comparación de base de datos NoSQL, información adaptada de Bases de datos NoSQL en cloud

computing, por Martín, A. E., Chávez, S. B., Rodríguez, N. R., Valenzuela, A., & Murazzo, M. A. (2013)

1.4.7 Base de datos NoSQL couchDB

(Apache Org., 2019) dice que:

Hace uso del omnipresente protocolo HTTP y el formato de datos

JSON y es compatible con cualquier software que los soporte,

CouchDB también funciona muy bien con herramientas externas

como servidores proxy HTTP, equilibradores de carga. (Apache Org.,

2019)

CouchDB es un servidor de base de datos NoSQL de código abierto provista por

Apache Org. Esta base de datos es compatible con cualquier lenguaje de programación que

permita generar aplicativos de informático que puedan consumir servicios web REST e

interpretar notación JSON, lo que la convierte en un base de datos muy potente en cuanto a

versatilidad se refiere.

(Apache Org., 2019) dice que:

Esta base de datos permite el almacenamiento multi-versión, lo que

ayuda a optimizar el almacenamiento y acceso, a través de la

Page 46: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 30

escritura contigua en secciones de disco y, por lo tanto, cuando se

actualiza, el documento completo puede ser reescrito más que bits o

piezas mantenidas en una estructura de base de datos no contigua

linkeada. (Apache Org., 2019)

Las bases de datos couchDB almacenan varias versiones de un mismo documento

JSON, lo cual ayuda cuando existen inconsistencias en los registros debido a un fallo en la

actualización de los datos, permitiendo solucionar eficientemente estos conflictos

recuperando la versión anterior del documento.

Otra funcionalidad que ofrece couchDB es que los documentos JSON pueden tener

archivos adjuntos tal como si de un correo electrónico de tratará, estos archivos pueden ser

de cualquier formato (audio, video, imagen, texto, etc.) los cuales al ser cargados a la base

de datos son transformado en archivos con extensión “couch” y depositados en el

directorio “data” que se encuentra dentro de la instalación de couchDB. Los adjuntos están

estrictamente ligados a su documento JSON principal, por lo que si se elimina el registro

también se borran los adjuntos, aunque para mejorar las consultas de datos couchDB

permite acceder a los documentos JSON y los archivos adjuntos por separado.

1.4.8 Caso: Sistema de gestión de expedientes de los estudiantes de la carrera de

ingeniería de sistemas computacionales

(Zuleta Sevilla, N. E., 2018) dice que:

Se recomienda implementar el sistema gestión de expedientes a la

nueva carrera de Ingeniería de Software y a todas las carreras de la

facultad; en el futuro a las facultades de la UTN debido a que

posibilitará el ahorro en tiempo y recursos al disponer en forma

inmediata y con precisión la información de los estudiantes. (Zuleta

Sevilla, N. E., 2018)

En la carrera de ingeniería en sistemas computacionales de la UNIVERSIDAD

TÉCNICA DEL NORTE, ubicada en la ciudad de Ibarra – Ecuador, se implementó un

sistema para gestionar los expedientes de los estudiantes, para este proyecto se usó la base

de datos CouchDB. En la recomendación de su proyecto nos indica que una base de datos

NoSQL es una opción viable para implementar sistemas documentales.

Page 47: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 31

Figura 7. Características de couchDB, información tomada de Estudio de la integración del lenguaje de

programación PHP con la base de datos NOSQL apache COUCHDB Sistema de gestión de expedientes de

los estudiantes de la carrera de Ingeniería en Sistemas Computacionales, por Zuleta Sevilla, N. E., (2018)

Por lo expuesto anteriormente este tipo de base de datos, en especial CouchDB ofrece

muchas características para este tipo de proyectos como es la capacidad de agregar

recursos según se requiera, tomando en cuenta que la función principal de la aplicación es

almacenar documentos digitalizados lo cual demanda gran cantidad de espacio de

almacenamiento y agilidad en procesamiento.

1.4.9 ¿Migrar o complementar?

Como define (Antaño, A. C. M., Castro, J. M. M., & Valencia, R. E. C., 2014) “La

propuesta de bases de datos NoSQL no es excluyente de las SQL, por el contrario, podrían

incluso utilizarse como complemento una de la otra.” Si bien es cierto las bases de datos

NoSQL son utilizadas para cubrir una brecha tecnológica dejada por las bases de datos

relacionales, pero esto no necesariamente quiere decir que son su reemplazo.

Por lo expuesto en la cita anterior se puede considerar tomar lo mejor de ambos mundos

y materializarlo en una misma solución tecnológica que permite cubrir las necesidades de

la organización.

Es por tal motivo que implementar una base de datos NoSQL para el almacenamiento y

centralización de las imágenes de los clientes de una empresa, no está ligado a migrar toda

la información de los clientes de una base de datos a otra, poder complementar las

Page 48: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 32

características de dos o más bases de datos permite migrar únicamente los datos

estrictamente necesarios para cubrir los objetivos planteados.

Existe otro beneficio que se deriva de esta premisa como que se reducen

considerablemente los costos y el tiempo que se dedicarían al proyecto o a posibles

cambios en los sistemas informáticos que accedan a dichos datos.

1.5 Marco Conceptual

1.5.1 Base de datos

(Date, C. J., 2001) dice que:

Un sistema de bases de datos es básicamente un sistema de

computadoras que se usa para llevar registros. Es posible considerar

a la propia base de datos como una especie de armario electrónico

para archivar; es decir, es un depósito o contenedor de una colección

de archivos de datos computarizados. (Date, C. J., 2001)

Figura 8. Imagen de un sistema de base de datos, información tomada de Introducción a los sistemas de

bases de datos, por Date C. J (2001).

Tener la información almacenada en una base de datos trae grandes ventajas para los

procesos cotidianos de una empresa entre las cuales podemos mencionar:

Compactación: No es necesario tener grandes archivadores metálicos llenos de papel.

Page 49: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 33

Velocidad: Los DBMS pueden buscar mucho más rápido la información en una base de

datos, que una persona encontrar un documento dentro de un archivero, y de la misma

manera actualizar dicha información.

Menos trabajo rutinario; Las tareas mecánicas y repetitivas siempre son mejor hechas

por una máquina que por un humano, por esto se puede eliminar gran parte del trabajo

de llevar los archivos manualmente.

Disponibilidad: En el momento que la necesitemos, tendremos a nuestra disposición

información precisa y actualizada.

1.5.2 Datos

Un dato es una representación simbólica de un atributo que puede ser de carácter

cuantitativo o cualitativo. Técnicamente hablando, los datos se representan como pulsos

eléctricos que pueden ser almacenados en los discos duros de los dispositivos informáticos.

La información es el resultado de la unión y procesamiento de varios datos. La

información tiene muchas aplicaciones, entre los cuales está la toma de decisiones.

1.5.3 Rendimiento de las bases de datos

El rendimiento de una base de datos está relacionada directamente al poder de

procesamiento del dispositivo en donde se ejecuta. Podemos encontrar una base de datos

en pequeños dispositivos como son los teléfonos celulares hasta en los servidores más

grandes conocidos como mainframes.

1.5.4 Sistema Administrador de Base de Datos

Los datos se almacenan físicamente en los discos duros, pero para administrar estos

datos es necesario un programa informático llamado DBMS (Data Base Management

System) que en español significa “Sistema Administrador de Base de Datos”, este sistema

permite manejar las conexiones y peticiones de los usuarios a la base de datos, además de

ocultar la complejidad del manejo de los datos, del mismo modo en que el lenguaje de

programación oculta al programador la complejidad de la comunicación con el hardware.

Page 50: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 34

1.5.5 Usuarios de un sistema de base de datos

Se denominan usuarios a las personas que de alguna manera utilizan las bases de datos y

se clasifican en tres grupos:

El Programador o desarrollador de programas que se dedica crear aplicaciones

informáticas y que acceden a los datos de la base de datos a través de consulta SQL.

El usuario final que interactúan indirectamente con la base de datos mediante las

aplicaciones desarrolladas por los programadores.

El administrador de base de datos o DBA, es la persona encargada de mantener en

funcionamiento la base de datos.

1.5.6 Las transacciones

Las transacciones son una herramienta que las bases de datos emplean para asegurar la

calidad de los datos almacenados. Esto se consigue aplicando una serie de reglas que

permiten que un conjunto de operaciones hechas sobre un dato sea considerado como una

sola tarea, es decir si un dato está siendo modificado por un proceso y este llegara a fallar

en alguna parte, entonces el dato tiene que volver a su estado original. Al conjunto de

tareas hechas sobre un dato se le denomina transacción.

1.5.7 Propiedades ACID

ACID (Atomicity Consistency Isolation Durability) que en español se traduce en

Atomicidad, Consistencia, Aislamiento y Durabilidad. Y hace referencia a las propiedades

que una base de datos debe tener para ser calificada como transaccional.

Atomicidad: Toda la transacción tiene que ser completada satisfactoriamente, de lo

contrario no se aplicará ningún cambio a los datos.

Consistencia: El dato deberá estar en un estado válido al inicio y al final de la

transacción, a esto también se le denomina integridad de los datos.

Aislamiento: Las transacciones se deben ejecutar de manera aislada, sin afectar o ser

afectadas por la ejecución de otras transacciones concurrentes.

Durabilidad: Una vez finalizada la transacción, ésta persistirá en la base de datos y no

se podrá deshacer, aunque falle el sistema.

Page 51: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 35

1.5.8 Bases de datos estructuradas o relacionales

Date, C. J., (2001) dice que: “Los principios de las bases de datos relacionales se

basan en la lógica y en las matemáticas. Campos de la ciencia que son muy confiables,

logrando heredar esa confianza para lograr sus objetivos”. Date, C. J., (2001)

Como su nombre lo indica son bases de datos cuya forma de almacenar los datos se

basan en una estructura y los datos están relacionados unos con los otros, las bases de datos

relacionales desde su creación han mantenido una hegemonía en el mercado de base de

datos. Siendo para estas el mayor presupuesto en investigaciones.

Según C. J. Date las bases de datos estructuradas se clasifican según su modelo de

datos, entre las cuales son: modelo jerárquico, modelo de red, Orientada a objeto y modelo

relacional.

1.5.9 Modelo Jerárquico

En ellas se organiza la información con una jerarquía en la que la relación entre las

entidades de este modelo siempre es del tipo padre-hijo. De esta forma hay una serie de

nodos que contendrán atributos y que se relacionarán con nodos hijos de forma que puede

haber más de un hijo para el mismo padre, pero un hijo sólo tiene un padre. Y el tipo de

relaciones entre nodos es de uno a varios.

Las entidades de este modelo se llaman segmentos y los atributos se denominan

campos. La forma visual de este modelo es de árbol en donde en la parte superior se

encuentran los nodos padres y en la parte inferior a sus hijos. Un uso práctico de este

modelo es el que podemos observar al trabajar con el sistema operativo Microsoft

Windows el cual almacena las carpetas con información en la parte superior y en la parte

inferior los archivos.

1.5.10 Modelo de red

Estas bases de datos también se las llaman bases de datos puntero y son semejantes a las

jerárquicas, pero un nodo hijo puede tener varios nodos padres, por lo que el tipo de

relación de los nodos es de varios a varios.

1.5.11 Modelo relacional

Las bases de datos relacionales se basan en el uso de tablas. Las tablas se representan

gráficamente como una estructura rectangular formada por filas y columnas, similar a una

Page 52: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 36

hoja de Excel. Cada columna almacena información sobre una propiedad de la información

que se almacena en la tabla (nombre, apellidos, edad, cédula, etc.) Cada fila posee un

ejemplar de la instancia o relación representada por la tabla (a las filas también se las llama

tuplas).

Figura 9. Representación de una tabla en el modelo relacional, información tomada de Introducción a los

sistemas de bases de datos, por Date C. J (2001).

1.5.12 Orientadas a objetos

Con la llegada de la programación orientada a objeto se comenzó a concebir la idea de

crear bases de datos que se adapten a estos lenguajes. Permitiendo guardar los datos junto a

los procesos tal como lo hacen estos lenguajes, en donde un objeto está conformado por

propiedades o atributos y métodos o procedimientos.

Además, las bases de datos orientadas a objetos también buscan implementar otros

conceptos de la programación orientada objetos tales como: la herencia, tipos de datos

definidos por el usuario, disparadores almacenados en la base de datos, soporte a tipo de

datos complejos.

Logrando superar las limitaciones del base de datos relacionales. (Introducción a los

sistemas de bases de datos, 2001).

1.5.13 Teorema CAP

El teorema CAP fue formulado por Eric Brewer y en el cual indica que las bases de

datos distribuidas normalmente basan sus funcionalidades principales en un teorema

conocido como CAP o también llamado teorema de Brewer’s. Este teorema

resumidamente afirma que todo sistema gestor de base de datos debe cumplir con tres

características propias de las aplicaciones web distribuidas, las cuales son: Consistencia,

Disponibilidad y Tolerancia a particiones.

Page 53: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 37

(Bancos de Dados NoSQL, 2012) dice que:

Así mismo Brewer expresa que en caso de que ocurra un error estas

bases de datos únicamente podrán garantizar el funcionamiento de

dos de estas características. Es decir, se debe renunciar a una de ellas

para lograr mantener las otras dos de manera simultánea. Y por este

motivo las bases de datos NoSQL para poder ser escalables y

distribuidas aplican distintos métodos ya que únicamente pueden

elegir, como máximo, dos de las tres características del teorema.

(Bancos de Dados NoSQL, 2012)

Dicho esto, las bases de datos que apliquen las características del teorema CAP deben

elegir implementar entre las propiedades ACID (Atomicidad, Consistencia, Aislamiento y

Durabilidad) y las BASE (Básicamente disponible, Estado flexible y Eventualmente

consistente).

Para poder decidir porque funcionalidades se deben considerar al momento de

seleccionar una base de datos, Eric Brewer nos propone lo siguiente:

Si el sistema o parte del sistema debe ser consistente y tolerante a fallos, entonces se

requiere optar por las propiedades ACID.

Si se puede permitir inconsistencias en los datos con el fin de favorecer la

disponibilidad y tolerancia a particiones, entonces bien pueden aplicarse las

propiedades BASE. Por ejemplo: Dynamo de Amazon.

Una tercera alternativa consiste en no optar entre propiedades ACID, ni BASE, sino en

mantener la consistencia y disponibilidad a costas de no ser completamente operativos

en presencia de fallos en la red, como es aplicado por Google en su base de datos

BigTable.

En la siguiente ilustración se describe gráficamente las características del teorema CAP

junto a las bases de datos NoSQL cuyas propiedades cumplan dichos puntos.

Page 54: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 38

Figura 10. Representación gráfica del teorema CAP, información tomada de Bancos de Dados NoSQL, por

Vieira, M. R., FIGUEIREDO, J. M. D., Liberatti, G., & Viebrantz, A. F. M. (2012)

1.5.13.1 Consistencia

La Consistencia se refiere a un contrato entre un almacenamiento de datos y los

procesos, en el cual el almacenamiento de datos específica precisamente cuales son los

resultados de las operaciones de lectura y escritura ante la presencia de concurrencia. Se

garantiza que, a partir de un cambio en el estado de un sistema, todo cliente que accediera

posteriormente obtendrá el nuevo valor del estado: “Cada petición recibe la respuesta

correcta”.

Es decir, el gestor de base de datos se debe de asegurar que siempre se obtenga la

misma información al consultar o grabar los datos, independientemente del nodo o servidor

que atienda la petición.

1.5.13.2 Disponibilidad

Esta característica permite que los clientes puedan leer o grabar información, aunque

uno o varios nodos estén fuera de servicio, además de reaccionar y adaptarse al

crecimiento continuo de trabajo de manera fluida sin perder calidad en los servicios

ofrecidos.

La Disponibilidad es la cualidad de un sistema para mantenerse operativo

principalmente ante contingencias: “Cada petición eventualmente recibe una respuesta”. La

Page 55: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 39

Alta Disponibilidad (HA) desde la visión de Eric Brewer implica mantener el servicio

funcionando ante la ocurrencia de fallos como los son:

Caídas y Fallas de discos

Actualizaciones de Bases de datos

Actualizaciones de Software

Actualizaciones de Sistema Operativo

Cortes de energía

Cortes en la red

Movimiento físico del equipo

1.5.13.3 Tolerancia a particiones

Tolerancia a particiones o tolerancia a fallos es la característica cuyo concepto dice que

los sistemas deben que seguir operables, aunque existan fallos o caídas parciales de la red.

Esto se refiere a que un sistema debe continuar en funcionamiento a pesar de la pérdida de

los mensajes entre uno y otro nodo ya sea porque uno de estos se separó de la red por falta

de conectividad.

1.5.14 Propiedades BASE

Por otra parte, los modelos de consistencia eventual contemplan máxima disponibilidad

y tolerancia al particionado, pero sacrifican la consistencia estricta en favor de estas dos

características. En los sistemas que implementan el modelo de consistencia eventual

conocida también como BASE (Basically Available Soft-state Consistency) es posible

que luego de una operación las distintas réplicas queden inconsistentes durante el periodo

de tiempo necesario para que la actualización de los datos se propague a todos los nodos.

Cuando se completa este proceso el sistema vuelve a un estado consistente. La

restauración de la consistencia se logra mediante el uso de transacciones de compensación

para el manejo de fallas.

La compensación de transacciones permite reemplazar una operación que fue ejecutada,

pero que falló por algún motivo. La operación que sustituye a la inicial puede proveer

capacidades similares a la original, o en su defecto, deshacer los resultados de la operación

original.

Page 56: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 40

1.5.15 Google File System y MapReduce

Google File System o GFS es un sistema de archivo creado por Google Inc. En donde

cada archivo es particionado en bloques que se distribuyen en cada servidor del clúster.

Los metadatos con la información referente al tamaño y ubicación de cada uno de los

bloques y sus respectivas réplicas son conservados por el Name Node.

(Eduardo Fabián Cajas Malavé, 2014) dice que:

MapReduce es un modelo de programación para computación

distribuida desarrollado por Google. Las Aplicaciones que se

escriben dentro del framework MapReduce pueden ser

automáticamente distribuidas en varios equipos sin la necesidad de

que el desarrollador escriba código personalizado para la

sincronización y paralelización. Puede ser utilizado para realizar

tareas sobre grandes conjuntos de datos, lo que sería demasiado

grande para manejarlo en una sola máquina. (Eduardo Fabián Cajas

Malavé, 2014)

La arquitectura MapReduce es la propuesta de Google para solucionar el problema que

acarrea trabajar con grandes cantidades de datos como son los procesos analíticos en línea

(OLAP), la cual se basa en dos funciones principales:

Map: El nodo principal mapea los datos creando segmentos de conjunto independiente

de datos, estos segmentos son asignados a nodos de trabajo para luego procesar

problemas más pequeños para al final devolver el resultado al nodo principal.

Reduce: Luego de la función map el nodo principal recibe los segmentos y los reúne

de tal forma que se obtiene el producto final.

Page 57: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 41

Figura 11. Representación gráfica del proceso mapreduce, información tomada de Una primera

aproximación al descubrimiento de subgrupos bajo el paradigma MapReduce, por Pulgar-Rubio, F.,

Carmona, C. J., Rivera-Rivas, A. J., González, P., & del Jesus, M. J., (2015)

1.5.16 Protocolo TCP/IP

Se denomina TCP/IP a la unión de dos protocolos, primero está el protocolo de control

de transferencia (TCP) que se encarga de controlar el flujo de los datos y asegurar que los

datos emitidos por el cliente lleguen sin errores o variaciones al servidor. Por el otro lado

está el protocolo de internet (IP) el cual se encarga de crear un direccionamiento en la red

de comunicación, proveyendo un encaminamiento de los datos desde el nodo emisor al

destino y viceversa. Este protocolo es en el que se basa el internet, permitiendo navegar en

la red mediante la dirección IP.

1.5.17 Protocolo HTTP

El protocolo HTTP son las iniciales por su nombre en inglés HyperText Transfer

Protocol (Protocolo de Transferencia de Hipertexto) el cual permite el intercambio de

datos entres dos equipos informáticos, generalmente uno es denominado servidor y el otro

cliente. La estructura de los datos que se transmitirán de un equipo a otro es definida por el

protocolo HTTP.

1.5.18 Servidor Web

Un servidor web es básicamente un equipo informático con determinadas características

de hardware y de software que permite publicar contenido electrónico en una red

Page 58: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 42

informática, sea está internet o una extranet o intranet de alguna empresa. Para lo cual se

utiliza el protocolo HTTP.

1.5.19 PHP (Hypertext Preprocessor)

PHP es un lenguaje de programación de código abierto orientado a ser un código script

que se ejecuta del lado del servidor. Este lenguaje de programación se puede mezclar

fácilmente con código HTML y es considerado un lenguaje de programación fácil de

aprender y el más utilizado a nivel mundial para programación web.

1.5.20 JSON (JavaScript Object Notation)

Es un formato de intercambio de datos ligero, usado actualmente por la mayoría de los

sistemas de información para transmitir los datos de un sistema a otro, la mayoría del

lenguaje de programación soportan la notación JSON y también es ampliamente utilizado

por las bases de datos NoSQL para manipular los datos en especial las de tipo clave-valor y

las orientada a documentos.

Figura 12. Representación de una estructura JSON, información tomada de Serialización/deserialización de

objetos y transmisión de datos con JSON, por Mora-Castillo, J. A., (2016)

1.5.21 CURL

Es un conjunto de librerías que conforman una herramienta en línea de comando o

script que permiten trasladar datos mediante diferentes protocolos de red, incluido el

HTTP. Esta herramienta trabaja de tal manera que simula ser un navegador web para

realizar las peticiones de datos a los servidores web.

CURL también está soportado por dientes lenguajes de programación como es el caso

de PHP que empaqueta a CURL en la Librería libcurl.

Page 59: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 43

Figura 13. Uso de librería CURL con lenguaje de programación PHP, información tomada de

https://www.php.net/manual/es/curl.examples.php

1.5.22 Servicio web REST (Representational State Transfer)

También llamado API REST, es un conjunto de tecnologías que permiten a diferentes

sistemas interoperar en la web, incluso si se encuentran en lugares distantes. En donde un

sistema publica sus servicios en calidad de procesos remotos y el otro sistema consume

dichos servicios, a esta tecnología se la denomina “procedimiento a través de la web”.

Esta tecnología se basa en los estándares de la web, siendo HTTP el protocolo de

transferencia de datos, los servicios web REST publicado son solicitados mediante un

identificador de recursos único o URI; la clave del éxito de este modelo de transferencia de

datos es su simplicidad en la utilización de los recursos de la web y en rapidez de su

implementación.

1.5.23 SoapUI

Es un programa de escritorio de tipo interfaz cliente, elaborado para realizar pruebas

funcionales de servicios web SOAP y REST.

1.5.24 Proyecto fauxton

Es una aplicación web nativa, que se encuentra integrada en la instalación de couchDB,

proporciona acceso a todas las funcionalidades de la base de datos. Es decir, Fauxton es la

interfaz gráfica de la base de datos couchDB para administrar tanto los datos que se

almacenan en ella como para administrar su configuración.

1.5.25 Diagramas

Los diagramas se pueden considerar como la representación gráfica de una acción y

relación que tiene varias partes. Los diagramas se pueden usar para describir fenómenos

conocidos.

Page 60: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 44

1.5.25.1 Diagrama de caso de uso

García-Holgado en 2018 indica que el diagrama de casos de uso es una técnica para

capturar información de cómo un sistema o negocio trabaja, o de cómo se desea que

trabaje.

El diagrama de caso de uso sirve para representar gráficamente los requisitos

funcionales del sistema basándose en las acciones ordenadas secuencialmente, inclusive se

debe describir las variantes que cualquier entidad pueda efectuar interactuando con el

actor. En ella se incluye los actores, las relaciones, el ámbito de la secuencia.

1.5.25.2 Diagrama de flujo de datos de contexto

El diagrama de flujo de contexto o también llamado modelo de entorno permite

esquematizar gráficamente el flujo de la información que entran y salen entre los

componentes o procesos básicos de un sistema, permitiendo una visión general de la

manera que operan los componentes de dicho sistema.

1.5.25.3 Diagrama de despliegue

Sirve para modelar la arquitectura de un programa informático en tiempo de ejecución,

permite diseñar la relación existente entre software y hardware y la distribución de

procesos, componentes y la comunicación existen ente entre ellos.

Figura 14. Ejemplo de diagrama de despliegue, información tomada de Desarrollo de Software Orientado a

Objeto usando UML, por Torres, P. L., (2004)

Page 61: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 45

1.5.26 Metodología de desarrollo de software

Gamboa, J. Z. en el 2018 indica que al menos en proyectos de desarrollo de software.

Podemos afirmar que el éxito de los proyectos de software depende en gran medida de que

tengan un buen inicio. La selección adecuada del modelo de implementación es un factor

decisivo para un buen inicio del proyecto. Para lo cual se debe considerar las necesidades y

características del mismo. La correcta selección de la metodología permitirá incrementar la

calidad del producto final y reducir el tiempo de entrega.

Actualmente hay una gran variedad de metodologías de desarrollo de software, existe

tantas que se torna un poco complicado elegir una al momento de iniciar un nuevo

proyecto.

La mayoría de las metodologías se encasillan en dos grandes grupos. Las cuales se

definen como las metodologías tradicionales y las metodologías ágiles.

Figura 15. Clasificación de metodologías de desarrollo, información tomada de Taxonomía de los modelos y

metodologías de desarrollo de software más utilizados, por Ojeda, J. C., & Fuentes, M. D. C. G., (2012)

1.5.26.1 Metodologías Tradicionales

Como se puede observar en la figura N° 15, las metodologías tradicionales son también

llamadas metodologías rígidas, esto debido a que los cambios o modificaciones al sistema

Page 62: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 46

no son bien aceptados durante el desarrollo del mismo, existen normas y políticas que

controlan en gran manera los procesos de desarrollo de software. Cabe mencionar que estas

metodologías están ideadas para ser aplicadas en medianos y grandes proyectos.

1.5.26.2 Metodologías ágiles

Las metodologías ágiles abarcan un conjunto de principios y valores que los

desarrolladores o equipos de desarrollo deben apegarse para poder responder rápida y

eficientemente a los cambios que surgen durante la vida de un proyecto, sin menoscabar la

calidad del trabajo que se realiza o del producto final. Todo esto se debe a que el desarrollo

de proyectos es un área que está en constante cambio en especial en el ámbito técnico, esto

debido a que cada día aparecen nuevas o mejoradas tecnologías.

Las metodologías ágiles nacen como alternativas a las tradicionales metodologías de

desarrollo de proyectos, las cuales se caracterizan seguir fielmente la documentación que

se genera durante antes del inicio del proyecto, sin posibilidad de cambios durante su

ejecución, por lo que son consideradas metodologías rígidas.

Figura 16. Comparación de metodologías ágiles y tradicionales, información tomada de Metodologías

ágiles para el desarrollo de software: eXtreme Programming (XP), por Letelier, P., (2012)

Page 63: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 47

1.5.26.3 SCRUM

Durante la última década SCRUM ha sido la metodología de gestión de proyecto más

utilizada por los equipos de desarrollo debido a que marca un camino que permite cambios

de requerimientos durante la realización del proyecto.

Figura 17. Representación de las fases de la metodología SCRUM, información tomada de Metodología

SCRUM, por Gallego, M. T. (2012)

La metodología SCRUM tiene algunas ventajas cuando es aplicada correctamente en la

gestión de proyectos, entre las cuales podemos señalar las siguientes:

La satisfacción de los clientes: SCRUM logra que el cliente sea parte del equipo de

trabajo, haciendo que el cliente se comprometa con el desarrollo del proyecto y esté

enterado en todo momento de los resultados de cada proceso.

Simplicidad: Las interacciones en SCRUM están debidamente identificadas, así como

los participantes de cada una de ellas, lo cual ayuda de gran manera con la aceptación

de la metodología por parte de los integrantes de cada equipo.

Inspección: SCRUM contempla tres procesos dedicados a la inspección: el sprint

diario, la revisión del sprint y la retrospectiva del sprint. Esto ayuda a la organización a

identificar qué procesos o eventos tiene que ser mejorados.

Adaptación: Esta metodología acepta cambios el cualquier momento, esté es el punto

diferenciador con el resto de las metodologías. Adicionalmente esté punto incrementa

la satisfacción del cliente.

Trabajo en equipo: SCRUM reconoce a cada integrante del equipo como una pieza

fundamental del proyecto, permite sinergia que fluye entre los integrantes incluido el

cliente, lo que hace que ellos se integren, se relaciones y mejores en conjunto.

A continuación, se describirá algunas de las desventajas que se pueden encontrar en la

aplicación la metodología SCRUM como marco referencial para la gestión de proyectos:

Page 64: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 48

Excesiva delegación de responsabilidades a los equipos.

Es una metodología tan flexible que de ser necesario se permite fallar.

El paradigma de desarrollo es ampliamente disímil al resto de metodologías, tanto que

origina cierta resistencia en su asimilación por parte de los nuevos integrantes.

1.5.26.4 RAD

El nombre de RAD proviene de su acrónimo en inglés (Rapid Application

Development) y es una metodología de desarrollo se sistemas informáticos en el cual sus

propiedades bases giran alrededor de la implementación de software de manera rápida,

práctica, a muy bajo costo y sin hacer de lado la calidad del producto final. El tiempo

estimado de vida de un proyecto elaborado con metodología RAD es de entre 60 y 90 días.

1.5.26.5 Fases de RAD

Las fases planteadas por RAD para el desarrollo proyecto de sistemas informáticos son

las siguientes:

Modelado de Gestión.

Modelado de datos.

Modelado de procesos.

Generación de aplicación.

Pruebas de entrega.

Figura 18. Fases de la metodología RAD, información tomada de Sistema de información bibliotecario para

la Biblioteca Manuela Beltrán, por: Caballero Narvaez, S., & Devia Palacio, D. S., (2018)

Page 65: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 49

1.5.26.6 Metodologías de desarrollo en implementación de bases de datos

Las metodologías de desarrollo de software no son exclusivas de la programación de

sistemas informáticos, puesto que su aplicación puede abordar proyectos de otras

características. Como lo es el proyecto “Diseño e implementación de una base de datos

para recogida y análisis de datos de actividad física provenientes de dispositivos

wearables” (López Ramírez, M. C., 2015) en el cual aplica la metodología de desarrollo de

en cascada; cual es considerada una metodología tradicional.

Gamboa, J. Z. en el 2018 indica que en el desarrollo del proyecto se emplea la

metodología ciclo de vida en cascada, que consiste en ejecutar actividades de manera

secuencial agrupadas en las fases; pre-análisis, análisis, diseño, implementación, pruebas y

documentación y que éste modelo está dirigido por los casos de uso y se centra en la

arquitectura del desarrollo.

El proyecto anteriormente mencionando marca una pauta muy importante para el

desarrollo de proyectos de similares características, debido a que dota mayor número de

herramientas con las que se pruebe trabajar.

1.5.27 Prueba de software

(Cárdenas Ospina, L. A., & Rodríguez Beltrán, J. A., 2016) dice que:

La etapa de pruebas consiste en realizar una prueba integral del

sistema, teniendo en cuenta la iteración entre los diferentes módulos

funcionales que lo componen. En esta actividad se realizará la

prueba del sistema como un conjunto de elementos que están

interrelacionados. (Cárdenas Ospina, L. A., & Rodríguez Beltrán, J. A.,

2016)

La prueba de software es una parte dentro del ciclo de desarrollo de software, en donde

se pone bajo análisis el comportamiento del sistema luego de su integración y la sinergia

existente entre los diferentes elementos que lo componen. Las pruebas de software se

realizan con la finalidad de demostrar que el sistema informático alcanza los niveles de

calidad acordados.

Page 66: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Marco teórico 50

1.5.27.1 Tipos de pruebas

Existen diversos enfoques dentro de la prueba de software, los cuales también son

llamados tipos de pruebas, éstos determinan qué características del software se probarán.

Existen diferentes tipos de pruebas de software que pueden ser usados para comprobar

el adecuado comportamiento del sistema luego de su implementación final. La selección y

utilización del tipo de prueba se basará netamente en las características del sistema que se

quieran evaluar; una de estas características es la funcionalidad de software.

(Jerez Mayorga, D. S., 2017) dice que:

La funcionalidad reúne un conjunto de atributos que permiten

calificar si un producto de software maneja en forma adecuada el

conjunto de funciones que satisfagan las necesidades para las cuales

fue diseñado. (Jerez Mayorga, D. S., 2017)

Probar la funcionalidad del software comprende las pruebas en donde se evalúa un

fragmento o la totalidad del programa informático para verificar que cumplan plenamente

con los requisitos del usuario.

1.5.27.2 Método de Caja Negra

(Jerez Mayorga, D. S., 2017) dice que:

Las pruebas de caja negra se centran en lo que se espera de un

módulo, es decir, intentan encontrar casos en que el módulo no se

ajusta a su especificación. Por ello se denominan pruebas

funcionales, el tester se limita a ingresar datos como entradas y

estudiar las salidas, sin preocuparse de lo que pueda estar haciendo

el módulo por dentro. (Jerez Mayorga, D. S., 2017)

El método de la caja negra centra los esfuerzos de las pruebas en validar únicamente

que las funcionalidades del sistema se encuentren alineados a las características

funcionales declaradas al inicio del proyecto. Aplicar esta prueba luego de la

implementación del software permite conseguir el visto bueno por parte de los usuarios

finales y por consiguiente la aceptación final del cliente.

Page 67: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

CAPÍTULO II

METODOLOGÍA

2.1 Tipo de investigación

(Cervo y Bervian. 1989), dice que:

Se define la investigación como una actividad encaminada a la

solución de problemas. Su objetivo consiste en hallar respuesta a

preguntas mediante el empleo de procesos científicos. (Cervo y

Bervian. 1989)

Con la finalidad de implementar una base de datos NoSQL que permite almacenar y

centralizar los documentos digitalizados de los clientes de la empresa Generali Ecuador

Cía. de Seguros S.A. Se efectuó un proceso investigativo con el objetivo de encontrar

respuestas a los problemas suscitados en dicha empresa.

(Rivero, D., 2013) dice que:

Estudios descriptivos: Sirven para analizar cómo es y cómo se

manifiesta un fenómeno y sus componentes. Permiten detallar el

fenómeno estudiado básicamente a través de la medición de uno o

más de sus atributos. (Rivero, D., 2013)

Para el presente proyecto se constituye una investigación de carácter descriptiva, la cual

permite obtener detalladamente las características de los fenómenos bajo su estudio, para

determinar cómo se manifiestan y sus consecuencias.

(Danhke, 1989), dice que:

Los estudios descriptivos buscan especificar las propiedades, las

características y los perfiles de personas, grupos, comunidades,

procesos, objetos o cualquier otro fenómeno que se someta a un

análisis. (Danhke, 1989)

Indagar y estudiar los procesos relacionados con el actual método de almacenamiento

de la documentación de los clientes de la empresa Generali Ecuador Cía. de Seguros,

permitirá desarrollar conclusiones sobre los problemas existentes y de la misma manera

Page 68: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 52

estas conclusiones servirán de guía para encontrar soluciones que logren alcanzar los

resultados deseados, tal como lo indica Sánchez.

(Sánchez, 2012) dice que:

Consiste en basarse en enunciados singulares, tales como

descripciones de los resultados de observaciones o experiencias para

plantear enunciados universales, tales como hipótesis o teorías.

(Sánchez, 2012)

2.2 Alcance de la investigación

La investigación en desarrollo tiene un corte cualitativo, con la cual se logrará acceder a

los resultados arrojados por el actual proceso de almacenamiento de documentos digitales

de los clientes de la empresa Generali Ecuador Cía. de Seguros S.A.

(Flores, García, & Rodríguez, 1996) dice que:

estudian la realidad en su contexto natural, tal y como sucede,

intentando sacar sentido de o interpretar los fenómenos de acuerdo a

los significados que tienen para las personas implicadas. La

investigación cualitativa implica la utilización y recogida de una gran

variedad de materiales, entrevistas, experiencia personal, etc., que

describen la rutina, las situaciones problemáticas y los significados

en la vida de las personas. (Flores, García, & Rodríguez, 1996)

El método cualitativo nos proveerá del conocimiento requerido para el desarrollo de los

procesos necesarios para la obtención de datos relacionados a la problemática de la

empresa. También se logra disipar las presentes dudas debido a la apertura de las

relaciones de diálogo con los entrevistados .

Aplicar los diferentes conceptos expuestos anteriormente aportará al desarrollo de la

investigación permitiendo captar y analizar los sucesos efectuados de manera aisladas, lo

que servirá para poder construir una hipótesis que favorezca con la búsqueda de la solución

al problema planteado.

Para recolectar los datos aplicando una investigación cualitativa es necesario realizar

diferentes técnicas de investigación al personal de la compañía involucrado en los procesos

de almacenamiento y centralización de los documentos digitales de los clientes, lo cual

Page 69: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 53

permite tener una perspectiva más clara del problema y despejar las dudas presentes sobre

los actuales procesos.

2.3 Técnicas de recolección de datos

Para el desarrollo del presente proyecto se planteó la aplicación de técnicas y

herramientas investigativas necesarias para la obtención de los datos más relevantes, lo

cual se puso en ejecución de manera crítica y sistemática permitiendo acceder hasta la

información requerida.

La recolección de datos y el posterior análisis de los datos se realizarán como etapas por

las cuales pasará esta investigación.

(Rivero, D., 2013) dice que:

La recolección de datos se refiere al uso de una gran diversidad de

técnicas y herramientas que pueden ser utilizadas por el analista

para desarrollar los sistemas de información, los cuales pueden ser la

entrevistas, la encuesta, el cuestionario, la observación, el diagrama

de flujo y el diccionario de datos. (Rivero, D., 2013)

Antes de iniciar la primera etapa es importante conocer previamente de qué forma se

van a clasificar los datos recolectados. Esto permitirá organizar correctamente dichos datos

con la finalidad de que, al llegar a la segunda etapa, se pueda analizar de forma adecuada la

información recopilada.

Según (Hernández, 2003) existen tres actividades que se deben tomar en cuenta al

momento de recolectar información e indica que estas actividades se encuentran

estrechamente vinculadas entre sí, las cuales son:

Seleccionar un instrumento o método de recolección de los datos.

Aplicar ese instrumento o método para recolectar datos.

Preparar observaciones, registros y mediciones obtenidas.

Por lo tanto, se puede decir que es de gran importancia conocer anticipadamente las

herramientas que se utilizaran para la recolección de datos; lo que permite darle mayor

soporte a la obtención de datos y por consiguiente la investigación se desarrollara de

manera eficiente.

Page 70: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 54

Para el desarrollo de este proyecto se considera la entrevista y la observación activa

como los métodos o técnica de recolección de datos, permitiendo construir bases sólidas en

la cual se sostiene la investigación y sus conclusiones.

2.3.1 Técnica de observación

Se considera la observación como técnica de recolección de datos porque por medio de

ella se podrá observar detenidamente las acciones y situaciones que se lleven a cabo en el

sistema, con la finalidad de obtener información del mismo y lograr armar una idea más

clara de los problemas y sus consecuencias.

(Arias, F. G., 1999) dice que:

La observación es una técnica que consiste en visualizar o captar

mediante la vista, en forma sistemática, cualquier hecho, fenómeno o

situación que se produzca en la naturaleza o en la sociedad, en

función de unos objetivos de investigación preestablecidos. (Arias, F.

G., 1999)

El campo de acción, la aplicación de la observación y el análisis se realizará en el

servicio prestado por el sistema web SIDD (Sistema de Digitalización de Documentos),

que contiene la base de datos en donde se almacena las imágenes de los documentos

legales de los clientes, se observará y tomará apuntes detalladamente del comportamiento

del sistema mientras es utilizado por los usuarios y también se observará detenidamente la

realización de los procesos administrativos sobre la actual base de datos.

2.3.1.1 Aplicación de la observación

Los lugares considerados para la aplicación de la observación son:

El departamento comercial de la empresa Generali Ecuador Cía. de Seguros S.A., que

es en donde los ejecutivos de cumplimiento ingresan, revisan y validan los documentos

de los clientes.

El departamento de sistemas de la empresa Generali Ecuador Cía. de Seguros S.A.,

específicamente en el cuarto de servidores. Se examinó la instalación del servidor web

del sistema SIDD y así mismo sus componentes de hardware y los aplicativos

instalados tal como es el actual gestor de base de datos que es MySql. Además, se

Page 71: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 55

prestó mucha atención en los procesos administrativos relacionados con la base de

datos de imágenes tales como respaldos y mantenimientos.

2.3.2 Técnica de la entrevista

Se consideró la aplicación de la entrevista como medio formal de recolección de datos,

la entrevista y el entrevistador son elementos fundamentales para la obtención de

información. Siendo esta una fuente primaria de información que ayudará a construir la

realidad de las necesidades de la empresa con relación al almacenamiento centralizado de

documentos de los clientes.

(Arias, F. G., 1999) dice que:

La entrevista, más que un simple interrogatorio, es una técnica

basada en un dialogo o conversación “cara a cara”, entre el

entrevistador y el entrevistado acerca de un tema previamente

determinado, de tal manera que el entrevistador pueda obtener la

información requerida. (Arias, F. G., 1999)

La entrevista es un instrumento eficaz y de gran precisión en la medida que la

investigación se fundamenta en la interrelación humana.

2.3.2.1 Aplicación de entrevistas

El perfil del personal entrevistado fue seleccionado basado en las funciones de la

empresa, las mismas que se encuentren estrechamente ligadas al entorno tratado en el

presente proyecto dentro de la empresa Generali Ecuador Cía. de Seguros S.A.:

Perfil de Entrevista # 1

Profesión: Administrador de base de datos

Nombre: Ing. Rodrigo Pazos

Lugar de Trabajo: Departamento de IT

Aporte cualitativo: La función primaria es ejecutar e implementar procesos

administrativos en las bases de datos de acuerdo a las necesidades del área, maneja

estadísticas de la base de datos, corrige anomalías de la base de datos, ejecuta sobre la base

Page 72: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 56

de datos las sentencias SQL a petición del equipo de programadores. Permitirá obtener

información sobre el estado actual de la base de datos de imágenes y su rendimiento.

Perfil de Entrevista # 2

Profesión: Gerente de IT y Gerente de emisiones

Nombre: Ing. Carlos Silva

Lugar de Trabajo: Departamento de IT

Aporte cualitativo: Permitirá obtener información relacionada con las estrategias

tecnológicas de la empresa con relación los servicios prestados a los clientes, así mismo

del plan de acción para mejorar los servicios a los clientes internos de la empresa.

Perfil de Entrevista #3:

Cargo: Analista de cumplimiento

Nombre: Sr. Johan Beltrán

Lugar de Trabajo: Departamento Comercial

Aporte cualitativo: La función desempeñada es de ingresar los documentos

digitalizados de los clientes al sistema SIDD, así mismo mantener dicha información

actualizada, permitirá recopilar datos sobre el rendimiento del sistema en la actualidad y su

impacto en la satisfacción del usuario.

2.3.2.2 Resumen de las entrevistas para especificaciones funcionales

El resumen de las entrevistas realizadas brinda la información requerida para la

implementación de una base de datos NoSQL para almacenar los documentos digitalizados

de los clientes de Generali Ecuador, implementando servicios web como capa de acceso a

datos, en el que servirá para realizar los procesos y la elaboración de la documentación, así

también como para el diseño de la base de datos.

En los anexos se puede revisar las preguntas y las respuestas de los entrevistados en las

respectivas entrevistas.

Page 73: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 57

2.3.2.3 Matriz de resumen de entrevistas

Entrevista para obtención de requerimientos para el análisis y diseño de la base

de datos para la empresa Generali ecuador

Fecha: 08/07/2019 Cargo: Analista de cumplimiento

Nombre

Entrevistador: Peter Celleri

Nombre

Entrevistado: Sr. Johan Beltrán

RESUMEN DE ENTREVISTA

Ingresar la documentación de los clientes es de gran importancia por el giro de negocio

de la compañía

Para ingresar los documentos de los clientes se utiliza una página web llamada SIDD

(Sistema de digitalización de documentos)

Los documentos de los clientes tiene una validez de 1 año, luego de esos hay que

volver a pedirlo y cargarlos al sistema SIDD.

Con el tiempo que pasa el sistema se torna más lento, incluso hay veces que la pagina

está fuera de servicio.

Cada vez la empresa tiene más y más clientes por lo que ingresar todos los

documentos se torna complicado y toma mucho tiempo, por lo lento que está el

sistema

Ayudará a mejorar el tiempo de repuesta del aplicativo al poder ingresar más clientes

en menor tiempo.

Toda la información del cliente es confidencial por lo tanto no se divulga y es de uso

exclusivo de Generali Ecuador.

Figura 19. Matriz del resumen de la entrevista, Investigación directa, por el autor (2019)

Page 74: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 58

Entrevista para obtención de requerimientos para el análisis y diseño de

procedimientos administrativos de la base de datos actual

Fecha: 09/07/2019 Cargo:

Administrador de la base de

datos

Nombre

Entrevistador: Peter Celleri

Nombre

Entrevistado: Ing. Rodrigo Pazos

RESUMEN DE ENTREVISTA

La base de datos del sistema SIDD esta implementada en Mysql

Las base de datos del SIDD actualmente tiene un peso de 120GB, con un incremento

anual del 20%

Se sacan respaldos diariamente de los datos, dicho proceso actualmente toma 8 horas y

con cada día que pasa el tiempo se incrementa.

Para sacar los respaldos se tiene que descargar algunos servicios del servidor. En

ciertas ocasiones, el respaldo falla y por lo tanto el servidor no restablece los servicios,

quedando el servidor fuera de línea.

Cambiar la base de datos por una base de datos más robusta y veloz permitirá

optimizar el tiempo de respuesta del servidor en peticiones de lectura y escritura.

Implementar replicación como método de contingencia permitirá reducir el tiempo que

se dedica a este proceso.

Figura 20. Matriz del resumen de la entrevista, Investigación directa, por el autor (2019)

Page 75: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 59

Entrevista para obtención de requerimientos para el análisis y diseño de la base

de datos para la empresa Generali ecuador

Fecha: 08/07/2019 Cargo: Gerente de TI

Nombre

Entrevistador: Peter Celleri

Nombre

Entrevistado: Ing. Carlos Silva

RESUMEN DE ENTREVISTA

Que el sistema de digitalización de documentos que sea ágil ayudara con las tareas

cotidianas del departamento de cumplimiento.

Tener una base de datos con mejores prestaciones permitirá mantener la información

siempre disponible.

Acceder a los datos mediante servicios web permitirá abstraer la capa de acceso a

datos del sistema SIDD, además de poder compartir el servicio de almacenamiento

con otros sistemas de la compañía.

Figura 21. Matriz del resumen de la entrevista, Investigación directa, por el autor (2019)

2.3.3 Recopilación documental

2.3.3.1 Búsqueda de cliente.

Para realizar la búsqueda de un cliente el usuario debe seleccionar la opción servicios

que se encuentra dentro del menú documentos. Los parámetros para la búsqueda pueden

ser: Cédula o RUC, apellido y nombre o código interno del cliente que es asignado por el

ERP de la compañía al momento de emitir una póliza al cliente.

Page 76: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 60

Figura 22. Formulario de búsqueda de cliente, información tomada del Sistema Integrado de Digitalización

de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)

2.3.3.2 Grupo de documentos

Los documentos de los clientes están divididos en grupos, cada grupo representa un tipo

específico de documento emitido o regulado por las entidades de control del estado, tales

como: Cédula de identidad, Planilla de servicios básicos, Acta de constitución de la

empresa, etc. Existen documentos opcionales y documentos obligatorios, Los documento

que son obligatorios el sistema los identifica marcándose con un asterisco “*”.

También existen indicadores gráficos que se utilizan para visualizar el estado actual del

grupo documentos; el color verde indica que el grupo tiene los documentos actualizados, el

color naranja que el grupo no tiene los documentos actualizados y el color rojo indica que

el grupo no tiene ni un documento ingresado.

Page 77: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 61

Figura 23. Formulario de grupo de documentos, información tomada del Sistema Integrado de

Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)

2.3.3.3 Pantalla de ingreso de documentos

En éste proceso se puede ingresar nuevos documentos para el cliente previamente

seleccionado, para este fin se tiene que seleccionar el grupo de documentos al cual se le va

a cargar el nuevo documento, luego seleccionar el archivo desde el directorio del sistema

operativo y presionar el botón grabar.

Page 78: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 62

Figura 24. Formulario de ingreso de nuevos documentos, información tomada del Sistema Integrado de

Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)

2.3.3.4 Pantalla de eliminación y descarga de documentos

En este proceso se puede eliminar o descargar un documento del cliente, para este fin se

tiene que seleccionar el grupo de documentos y luego seleccionar la imagen de

previsualización del documento que se quiere eliminar o descargar, luego se presentará el

documento en pantalla completa.

Page 79: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 63

Figura 25. Formulario de consulta de documentos, información tomada del Sistema Integrado de

Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)

Figura 26. Descarga o eliminación de documentos, información tomada del Sistema Integrado de

Digitalización de Documentos de la empresa Generali Ecuador Cía. de Seguros S.A., por el autor (2019)

Page 80: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 64

2.3.3.5 Formato de registro de novedades de respaldo de base de datos

En este proceso el administrador de base de datos ejecuta un archivo de tipo “bat” que

inicia el proceso de respaldo de la base de datos y verifica las novedades que se han

presentado para realizar los reportes. Este proceso se lo realiza diariamente.

Figura 27. Formato de registro de ejecución de respaldos, información tomada de los registros de la

empresa Generali Ecuador Cía. de Seguros S.A., por el administrador de la base de datos (2019)

2.3.3.6 Reporte estadístico elaborado en Excel

Mensualmente se genera un reporte estadístico en base a la bitácora del proceso de

respaldo de la base de datos del sistema SIDD, la información obtenida de la bitácora es

cuantificable y es en gran medida necesaria para la toma de decisiones con respecto a la

necesidad de cambiar de base de datos.

Figura 28. Reporte estadístico del proceso de respaldos, información tomada de los registros de la empresa

Generali Ecuador Cía. de Seguros S.A., por el administrador de la base de datos (2019)

Page 81: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 65

2.3.3.7 Notificación sobre problemas en el proceso de respaldos

Se presenta la siguiente prueba en donde se notifica al Gerente IT sobre la existencia de

inquietudes con relación al proceso de respaldo de la base de datos del sistema SIDD, en la

cual se indica que para realizar un respaldo se tiene que copiar la carpeta en donde se

encuentra instalada la base de datos.

Adicionalmente se informa el tiempo aproximado en restaurar dicha base de datos desde

una copia de seguridad es de 8 hora.

Figura 29. Notificación de problemas en la base de datos de MySql, información tomada de los registros de

la empresa Generali Ecuador Cía. de Seguros S.A., por autor (2019)

Page 82: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 66

2.3.3.8 Análisis documental

Las entrevistas y las observaciones permitieron recabar datos que posteriormente fueron

sometidos a diferentes análisis y cuestionamientos, que luego de ser cotejados con otros

conocimientos dieron como resultados información que sirvió de aporte útil para la

realización de la solución planteada, la cual consiste en implementar un base de datos no

estructura que permitirá almacenar y centralizar la información de los clientes de la

empresa Generali Ecuador Cía. De Seguros S.A.

Con respecto a las entrevistas, se logró obtener información veraz y oportuna de las

personas que se benefician de los servicios ofrecidos por el sistema SIDD y también las

personas que ejecutan los procesos administrativos de la base de datos.

Finalmente, con la observación se pudo examinar los procesos y a las personas que

intervienen en la realización de los mismos. Dando como resultado lo necesario que sería

contar con otra base de datos con mejores prestaciones que la actual.

2.4 Arquitectura

Se acogió la base de datos NoSQL couchDB debido a que presenta una arquitectura de

acceso a datos HTTP client, la cual permite manipular los datos mediante servicios web

REST, lo que permite que se pueda implementar como una nube (cloud) en la intranet de la

compañía y que todos los sistemas informáticos de puedan consumir sus servicios.

CouchDB integra una arquitectura de replicación (online/offline) que puede ser activada

programáticamente o manualmente mediante una petición HTTP.

Figura 30. Arquitectura de couchDB, información tomada de Estudio de la integración del lenguaje de

programación PHP con la base de datos NOSQL apache COUCHDB Sistema de gestión de expedientes de

los estudiantes de la carrera de Ingeniería en Sistemas Computacionales, por Zuleta Sevilla, N. E., (2018)

Page 83: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 67

2.5 Metodología de desarrollo

Teniendo la premisa que el tiempo es un factor limitante en el desarrollo de proyectos se

planteó una metodología de desarrollo que optimice dicho recurso.

Además, con la determinación de completar el cronograma de actividades y mejorar los

actuales procesos de almacenamiento y centralización de documentos digitales de la

empresa Generali Ecuador Cía. de Seguros S.A., se realizó un análisis de las metodologías

de desarrollo de software que se acoplen a los requerimientos funcionales del presente

proyecto y que además se adapte a la implementación de una base de datos NoSQL.

Para lograr lo mencionado en los párrafos anteriores se propone adoptar “RAD” como

metodología de desarrollo, esta metodología propone un desarrollo veloz de los proyectos

informáticos. Por lo tanto, basado en las fases propuestas por RAD se propone las

siguientes etapas en la presente implementación.

Figura 31. Etapas del presente proyecto basado en la metodología RAD, por el autor (2019)

2.6 Identificación del problema

En la siguiente Tabla se puede observar los diferentes tipos de problemas que presenta

actualmente la base de datos en dónde se almacena las imágenes de los clientes de la

compañía.

Page 84: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 68

Tabla 1. Resumen de problemas detectados en el personal de cumplimiento

PERSONAL DE CUMPLIMIENTO

Problemas Causas Efectos

El sistema SIDD se

tarda en consultar o

grabar los documentos

de un cliente

- No es posible manejar

este tipo de datos

(Imágenes).

- Debido al tamaño

actual de la base de

datos.

- Retraso en los procesos de

cumplimiento.

- Malestar en los usuarios.

Pérdida de

información.

- Tablas corruptas en la

base de datos de

imágenes.

- Volver a registrar la

documentación de los clientes

ingresada el último día.

- Reportar el evento al

departamento de riesgos.

Nota. Fuente: Investigación directa, por el autor (2019)

Tabla 2. Resumen de problemas detectados en el departamento de IT

ADMINISTRADOR DEL CENTRO DE COMPUTO

Problemas Causas Efectos

Pérdida de tiempo en

procesos

administrativos de la

base de datos

- Base de datos muy

pesada (gran cantidad

de información).

- Demora en la ejecución de

respaldo de la base de datos de

imágenes

Tablas corruptas.

- Base de datos no apta

para manejar grandes

volúmenes de datos.

- Pérdida de información.

- Pérdida de tiempo en

restauraciones de respaldo

Usuarios internos

insatisfechos por

retardo en el sistema.

- Servidor con recursos

limitados.

- Los recursos de sistemas como

procesador y memoria

principal se agotan cuando se

trabaja con múltiples

instancias del sistema.

Nota. Fuente: Investigación directa, por el autor (2019)

Page 85: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 69

2.7 Especificaciones funcionales

2.7.1 Requerimientos funcionales

Tabla 3. Requerimientos funcionales

Código Requerimiento Usuario

RQ000 Conexión a la base de datos mediante

servicios web REST Personal de TI

RQ001 Inserción de documentos digitalizados Personal de

cumplimiento

RQ002 Descarga de documentos digitalizados Personal de

cumplimiento

RQ003 Eliminación de documentos

digitalizados

Personal de

cumplimiento

RQ004 Replicación del servidor Personal de TI

Nota. Fuente: Investigación directa, por el autor (2019)

2.7.2 Requerimientos no funcionales

A continuación, se procede a detallar los requerimientos no funcionales para la

implementación de la base de datos NoSQL.

Tabla 4. Requerimientos no funcionales

Código Requerimiento

RN000 Base de datos debe ser implementada basándose en la

infraestructura existente en el centro de cómputo de la compañía

RN001 Interface entre la aplicación de alto nivel SIDD y la base de datos

couchDB

RN002 Interface de red: Protocolo TCP/IP

Nota. Fuente: Investigación directa, por el autor (2019)

2.8 Casos de uso

Un caso de uso es una manera de utilizar el sistema o de interactuar con él. Los casos de

uso proporcionan una definición de las necesidades a cubrir por un proyecto desde el punto

de vista del usuario. Por lo tanto, es una técnica utilizada para ayudar al cliente a

determinar sus necesidades y requisitos. (Areba, 2001)

Page 86: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 70

Se detalla los procesos y sus relaciones mediante el diagrama de casos de uso; esto

permitirá detallar gráficamente todos los procesos del sistema de acuerdo a las necesidades

presentadas en el proyecto.

2.8.1 Definición de actores de casos de uso y listado de roles

Se especifica a continuación los actores que intervienen en la colaboración de

recopilación de la información:

Tabla 5. Lista de roles

Nota. Fuente: Investigación directa, por el autor (2019)

2.8.2 Diagramas de casos de uso

El diagrama de caso de uso que se mostrará a continuación permitirá explicar

gráficamente los requerimientos funcionales que contempla el presente proyecto.

2.8.2.1 Diagramas de casos de uso de mantenimiento de documentos

Figura 32. Diagrama de casos de uso de interacción con el sistema, Describe la comunicación entre el

usuario y el sistema SIDD, por el autor (2019)

Nombre Descripción

Oficial de cumplimiento Personal que ingresa o registra la documentación

de los clientes en el sistema SIDD.

Administrador de base de datos

Es la persona que va a administrar la base de datos

de las imágenes.

Page 87: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 71

2.8.2.2 Descripción de casos de uso

Se procede a describir detalladamente el comportamiento entre la base de datos

couchDB y el usuario (ejecutivo de cumplimiento) mediante el Sistema de Digitalización

de Documentos (SIDD) según lo graficado en el diagrama de casos de uso.

2.8.2.3 Descripciones de casos de uso de insertar documento

Código: RQ001 Nombre: Ingresar imagen

Actor: Ejecutivo de cumplimiento Fecha: 08/07/2019

Precondición:

El archivo de imagen debe existir en la computadora del usuario.

Flujo de Eventos

Acción Actor

1.- Seleccionará la opción de consulta de

clientes que está dentro del menú

consultas.

3.- El ejecutivo ingresa los datos

requeridos y selecciona el botón consultar

los datos del cliente.

5.- El ejecutivo selecciona un grupo de

imagen.

7.- El ejecutivo selecciona el botón

agregar nueva imagen.

9.- El ejecutivo selecciona el archivo de

tipo imagen que desea cargar y selecciona

el botón aceptar.

Sistema

2.- Se visualizará la pantalla de búsqueda.

4.- Se visualizará los datos del cliente y los

grupos de imágenes.

6.- Se visualizará la pantalla de carga de

documentos.

8.- Se visualizará la ventana de búsqueda de

archivos del sistema operativo.

10.- Se guarda la imagen en la base y se

visualizará un mensaje de carga exitosa.

Flujo Alterno: Error archivo no se cargó

Postcondición: Imagen guardada en la base de datos.

Figura 33. Formulario de descripción de caso de uso insertar documentos, Investigación directa, por el

autor (2019)

Page 88: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 72

2.8.2.4 Descripciones de casos de uso de descargar documento

Código: RQ002 Nombre: Descargar imagen

Actor: Ejecutivo de cumplimiento Fecha: 08/07/2019

Precondición: La imagen tiene que existir en la base de datos

Flujo de Eventos

Acción Actor

1.-Seleccionará la opción de consulta de

clientes que está dentro del menú

consultas.

3.- El ejecutivo ingresa los datos

requeridos y selecciona el botón consultar

los datos del cliente.

5.- El ejecutivo selecciona un grupo de

imagen.

7.- El ejecutivo selecciona la imagen que

desea descargar.

9.- El ejecutivo selecciona el botón

descargar.

Sistema

2.- Visualizará la pantalla de búsqueda.

4.- Se visualizará los datos del cliente y los

grupos de imágenes.

6.- Se muestra lista de las imágenes del

cliente.

8.- Se presenta la imagen en pantalla

completa.

Flujo alterno:

El cliente no existe, el cliente no tiene imágenes cargadas, imagen no existe

Postcondición: Archivo descargado en la computadora

Figura 34. Formulario de descripción de caso de uso descargar documentos, Investigación directa, por el

autor (2019)

Page 89: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 73

2.8.2.5 Descripciones de casos de uso de eliminar documentos

Código: RQ003 Nombre: Eliminar imágenes

Actor: Ejecutivo de cumplimiento Fecha: 08/07/2019

Precondición: La imagen debe existir en la base de datos.

Flujo de Eventos

Acción Actor

1.-Seleccionará la opción de consulta de

clientes que está dentro del menú

consultas.

3.- El ejecutivo ingresa los datos

requerido y selecciona el botón consultar

los datos del cliente.

5.- El ejecutivo selecciona un grupo de

imagen.

7.- El ejecutivo selecciona la imagen que

desea eliminar.

9.- El ejecutivo selecciona el botón

eliminar.

Sistema

2.- Visualizará la pantalla de búsqueda.

4.- Se visualizará los datos del cliente y los

grupos de imágenes.

6.- Se muestra lista de las imágenes del

cliente.

8.- Se presenta la imagen en pantalla

completa.

10.- Se elimina la imagen de la base de

datos y se muestra un mensaje de

eliminación exitosa.

Flujo alterno: Error no se eliminó el registro, imagen no existe.

Postcondición: Registro eliminado de la base de datos

Figura 35. Formulario de descripción de caso de uso eliminar documento, Investigación directa, por el

autor (2019)

2.9 Diagrama de flujo de datos de contexto

El DFD de contexto contiene únicamente un proceso que describe este sistema, la base

de datos planteada en el proyecto, las entidades externas que interactúan con el sistema y

los flujos de datos.

Page 90: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Metodología 74

Figura 36. Diagrama de flujo de datos de contexto, Se demuestra gráficamente el flujo de los datos entre los

procesos que lo componen, por el autor (2019)

En el diagrama de flujo se puede observar como el oficial de cumplimiento

proporcionan datos a la base de datos mediante el ingreso y eliminación de documentos

digitalizados y, a cambio recibe información obtenida de las consultas de los documentos

digitalizados. Por otra parte, el administrador del centro de cómputo obtiene información

de la base de datos para realizar tareas administrativas.

2.10 Diagrama de despliegue

Figura 37. Diagrama de despliegue, se presenta gráficamente la estructura y la distribución de los

componentes entre los diferentes componentes que integran el proceso. Por el autor (2019)

Page 91: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

CAPÍTULO III

PROPUESTA

3.1 Introducción

3.1.1 Tema

Implementación de un almacén de imágenes digitales utilizando una base de datos

NoSQL que permita a la empresa Generali Ecuador Cía. de Seguro S.A. guardar

documentos de sus clientes.

3.1.2 Objetivo

Implementar un repositorio de datos que cumpla con la necesidad de la gestión del

departamento de cumplimiento de Generali Ecuador, para mejorar y controlar las

actividades que se efectúan en la misma, de esta manera lograr tener una óptima toma de

decisiones.

3.1.3 Entorno de software

Para el Análisis y diseño de la base de datos se contempla la arquitectura y prestaciones

de la base de datos CouchDB. Para que se ejecuten las funciones de almacenamiento de

datos y la implementación de servicios web REST en reemplazo de la capa de accesos a

datos.

3.2 Fase de diseño

3.2.1 Modelo entidad – relación

Para mayor información del proyecto se mostrará el modelo entidad-relación del

sistema SIDD, la parte que se encuentra sobre una base de datos MYSQL. Mientras que la

base de datos que se encuentra en couchDB no puede ser diagramado por ser una base de

datos no estructurada.

Page 92: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 76

Figura 38. Diagrama de modelo de datos MySql, Representación gráfica de las estructuras de las tablas de

la base de datos MySql del sistema SIDD, por el autor (2019)

Page 93: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 77

3.2.2 Diagrama de actividades

Los siguientes diagramas expresan gráficamente los requerimientos levantando en el

presente proyecto.

DIAGRAMA DE ACTIVIDAD - DESCARGA DE IMAGEN

Usuaio SIDD couchDB

Iniciar

Presentar lista de documentos

Consultar cliente

Seleccionar grupo de documentos

Presentar grupos de documentos

Seleccionar documento

Presentar documento

Solicitar documento

Seleccionar botón descargar

Procesar solicitud

Terminar

Figura 39. Diagrama de actividad de descarga de documento, Se describe en flujo de las actividades de la

operación entre la base de datos, el sistema SIDD y la base de datos NoSQL, por el autor (2019)

Page 94: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 78

DIAGRAMA DE ACTIVIDAD - INGRESAR DOCUMENTO

Usuaio SIDD CouchDB

Iniciar

Presentar lista de documentos

Consultar cliente

Seleccionar grupo de documentos

Presentar grupos de documentos

Presionar botón Seleccionar

archivo

Presionar botón Grabar

Insertar registro JSON

Terminar

Solicitar inserción

Figura 40. Diagrama de actividad de ingresar documentos, Se describe en flujo de las actividades de la

operación entre la base de datos, el sistema SIDD y la base de datos NoSQL, por el autor (2019)

Page 95: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 79

DIAGRAMA DE ACTIVIDAD - ELIMINAR DOCUMENTO

Usuaio SIDD couchDB

Iniciar

Presentar lista de documentos

Consultar cliente

Seleccionar grupo de documentos

Presentar grupos de documentos

Seleccionar documento

Presentar documento

Solicitar documento

Seleccionar botón eliminar

Procesar solicitud

Terminar

Solicitar eliminación

Eliminar registro JSON

Figura 41. Diagrama de actividad de eliminar documento, Se describe en flujo de las actividades de la

operación entre la base de datos, el sistema SIDD y la base de datos NoSQL, por el autor (2019)

Page 96: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 80

3.2.3 Diccionario de la base de datos – MySql

3.2.3.1 Diccionario de la tabla de documentos

Figura 42. Diccionario de la tabla de documentos, información tomada de la base de datos del Sistema

Integrado de Digitalización de documentos, por el autor (2019)

Page 97: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 81

Figura 43. Formulario de descripción de la tabla documentos, Investigación directa, por el autor (2019)

Universidad de Guayaquil Licenciatura en Sistemas de Información

DICCIONARIO DE DATOS

Página 1 de 5

Fecha de elaboración: 31/07/2019

PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar

MODULO DE: Versión 1.0

TABLA: DOCUMENTOS TIPO TABLA: MAESTRA

DESCRIPCIÓN: Contiene el listado de los tipos de documentos del sistema informático SIDD.

Descripción del registro

No. Nombre del campo Definición Tipo Sec Formato Long Null

1 docu_secuencia Valor incremental PK A I 11 No

2 docu_nombre Nombre del grupo de documento

E M VC 50 Si

3 docu_obligatorio Indica si el grupo de documentos es obligatorio

E M S 4 Si

4 docu_condicion Contiene la condición para identificar si es obligatorio

E M VC 255 Si

5 docu_orden Orden en que se presentará en la pantalla

E M S 4 Si

OBSERVACIÓN:

Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato

Secuencia A Automática M Manual

Formato numérico I Integer S Small Integer DC Decimal M Money

Formato caracter C Char VC Varchar

Formato fecha D Date DT DateTime

Page 98: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 82

3.2.3.2 Diccionario de la tabla de cliente

La tabla “cliente” contiene las referencias de los registros del cliente en el sistema SIDD

con los datos sistema ERP de la compañía.

Figura 44. Diccionario de la tabla de clientes, información tomada de la base de datos del Sistema

Integrado de Digitalización de documentos, por el autor (2019)

Page 99: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 83

Figura 45. Formulario de descripción de la tabla cliente, Investigación directa, por el autor (2019)

Universidad de Guayaquil Licenciatura en Sistemas de Información

DICCIONARIO DE DATOS

Página 2 de 5

Fecha de elaboración: 31/07/2019

PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar

MODULO DE: Versión 1.0

TABLA: CLIENTE TIPO TABLA: MAESTRA

DESCRIPCIÓN: Contiene el listado de las relación de la tabla de clientes del sistema SIDD con el ERP de la compañía.

Descripción del registro

No. Nombre del

campo Definición Tipo Sec Formato Long Null

1 cliente_clave Valor incremental PK A I 11 No

2 clave Código del cliente en el

ERP de la compañía

E M C 8 No

OBSERVACIÓN:

Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato

Secuencia A Automática M Manual

Formato numérico I Integer S Small Integer DC Decimal M Money

Formato caracter C Char VC Varchar

Formato fecha D Date DT DateTime

Page 100: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 84

3.2.3.3 Diccionario de la tabla grupo de documentos del cliente

Figura 46. Diccionario de la tabla grupo de documentos del cliente, información tomada de la base de datos

del Sistema Integrado de Digitalización de documentos, por el autor (2019)

Page 101: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 85

Figura 47. Formulario de descripción de la tabla clientesdocumentos, Investigación directa, por el autor

(2019)

Universidad de Guayaquil Licenciatura en Sistemas de Información

DICCIONARIO DE DATOS

Página 3 de 5

Fecha de elaboración: 31/07/2019

PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar

MODULO DE: Versión 1.0

TABLA: CLIENTESDOCUMENTOS TIPO TABLA: TRANSACCION

DESCRIPCIÓN: Contiene el registro de las actividades que se realizan en los grupos de documentos.

Descripción del registro

No. Nombre del campo Definición Tipo Sec Formato Long Null

1 clave Valor incremental PK A I 11 No

2 clientes_clave Clave del cliente FK M I 11 No

3 documento Nombre documento FK M VC 50 No

4 ruta Campo obsoleto, ya no se usa

E M VC 255 No

5 contador Cantidad de documentos

E M I 11 Si

6 fecha_captura Fecha de ingreso E M D 1 No

7 fecha_expiracion Fecha de caducidad de la imagen

E M D 1 No

OBSERVACIÓN:

Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato

Secuencia A Automatica M Manual

Formato numérico I Integer S Small Integer DC Decimal M Money

Formato caracter C Char VC Varchar

Formato fecha D Date DT DateTime

Page 102: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 86

3.2.3.4 Diccionario de la tabla imágenes del documento

Figura 48. Diccionario de la tabla imágenes del documento, información tomada de la base de datos del

Sistema Integrado de Digitalización de documentos, por el autor (2019)

Page 103: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 87

Figura 49. Formulario de descripción de la tabla clientesdocumentosimagenes, Investigación directa, por el

autor (2019)

Universidad de Guayaquil Licenciatura en Sistemas de Información

DICCIONARIO DE DATOS

Página 4 de 5

Fecha de elaboración: 31/07/2019

PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar

MODULO DE: Versión 1.0

TABLA: CLIENTESDOCUMENTOSIMAGENES TIPO TABLA: TRANSACCIÓN

DESCRIPCIÓN: Contiene el registro de las actividades de la carga de imágenes a un grupo de documentos

Descripción del registro

No. Nombre del campo Definición Tipo Sec Formato Long Null

1 clave Valor incremental PK A I 11 No

2 clavedocumento Clave documento FK M I 11 No

3 tipo Tipo de archivo E M C 50 No

4 nombre Nombre del archivo E M VC 255 No

5 Id_revision Identificado único de revisión de couchDB

E M VC 255 No

OBSERVACIÓN:

Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato

Secuencia A Automática M Manual

Formato numérico I Integer S Small Integer DC Decimal M Money

Formato caracter C Char VC Varchar

Formato fecha D Date DT DateTime

Page 104: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 88

3.2.4 Diccionario de la base de datos – CouchDB

A continuación, se ilustrará la estructura de la base de datos en couchDB para el

repositorio de documentos digitalizados, cabe mencionar su representación se hará en

notación JSON por ser una base de datos NoSQL orientada a documentos.

3.2.4.1 Diccionario de documento JSON documentos

Figura 50. Estructura de documento JSON documentos, por el autor (2019)

Page 105: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 89

Figura 51. Formulario de descripción de documento JSON imágenes, Investigación directa, por el autor

(2019)

Universidad de Guayaquil Licenciatura en Sistemas de Información

DICCIONARIO DE DATOS

Página 5 de 5

Fecha de elaboración: 31/07/2019

PROYECTO: SIDD INTEGRANTES: Celleri Gavilanez Peter Omar

MODULO DE: Versión 1.0

TABLA: TIPO TABLA: TRANSACCIÓN

DESCRIPCIÓN: Representación de documento JSON que almacenan los datos de los archivos digitalizados cargados a couchDB

Descripción del registro

No. Nombre del

campo Definición Tipo Sec Formato Long Null

1 _id Id del archivo en el sistema SIDD PK M I 11 No

2 _rev Id. De revisión PK A VC 50 No

3 sistema Nombre del sistema de la compañía que ingresa el registro

E M VC 255 Si

4 tipo_documento Nombre del grupo de documento

E M VC 255 Si

5 codigo_cliente Clave del cliente del ERP de la compañía

E M S 8 Si

6 _attachments Registro del archivo adjunto E A VC 255 No

7 content_type Tipo de contenido del archivo E A VC 255 No

8 revpos Número de modificación E A I 11 No

9 digest Cadena de comprobación MD5 E A VC 255 No

10 length Tamaño de archivo adjunto E A I 11 No

11 stub Indica si e adjunto se conserva en caso de actualizar el documento JSON

E A B 1 No

OBSERVACIÓN:

Tipo PK Clave Primaria FK Clave Foránea E Elemento de dato

Secuencia A Automática M Manual

Formato numérico I Integer S Small Integer DC Decimal M Money

Formato caracter C Char VC Varchar

Formato fecha D Date DT DateTime

Fortmato logico B Boolean

Page 106: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 90

3.3 Pruebas

Como se mencionó anteriormente el sistema de base de datos couchDB no permite el

acceso o la manipulación directa de los datos. En su lugar provee una serie de servicios

web REST que son los encargados de realizar las operaciones de escritura y lectura de los

datos.

También cabe mencionar que se realizaron modificaciones al sistema web SIDD

(Sistema Integrado de Digitalización de Documentos) para que pueda almacenar los

archivos de los clientes en la base de datos de couchDB.

Luego de finalizar la implementación de la base de datos, se dio inicio al proceso de

pruebas funcionales. Dicho proceso tiene como objetivo principal los siguientes puntos:

Probar el adecuado funcionamiento del servidor de base de datos.

Comprobar la disponibilidad y la operatividad de los servicios web

REST provisto por la base de datos.

Probar la integración del sistema SIDD de la compañía con la nueva

base de datos.

Para lograr esto objetivos se dispuso utilizar el programa SoapUI que permitió testear

los servicios web REST y obtener la respuesta enviadas por el servidor y por otra parte se

utilizó fauxton que es la interfaz gráfica de couchDB y que permitió corroborar los

resultados de las operaciones realizadas por el sistema SIDD.

Las pruebas operativas se realizaron en base a los requerimientos funcionales; por

consiguiente, se muestran las plantillas con la información de los casos de prueba.

Page 107: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 91

3.3.1 Casos de prueba

3.3.1.1 Caso de prueba conexión a la base de datos mediante servicio web REST

Figura 52. Formulario de caso de prueba conexión a la base de datos mediante servicio web REST,

Investigación directa, por el autor (2019)

Page 108: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 92

3.3.1.2 Caso de prueba de insertar documento

Figura 53. Formulario de caso de prueba de insertar datos mediante servicio web REST, Investigación

directa, por el autor (2019)

Page 109: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 93

3.3.1.3 Caso de prueba de descargar documento

Figura 54. Formulario de caso de prueba consultar datos mediante servicio web REST, Investigación

directa, por el autor (2019)

Page 110: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 94

3.3.1.4 Caso de prueba de eliminar documento

Figura 55. Formulario de caso de prueba eliminar datos mediante servicio web REST, Investigación directa,

por el autor (2019)

Page 111: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 95

3.3.2 Pruebas con SoapUI

Figura 56. Conexión a la base de datos mediante servicio web REST, captura de pantalla del sistema

SoapUI, por el autor (2019)

Figura 57. Insertar datos mediante servicio web REST, captura de pantalla del sistema SoapUI, por el autor

(2019)

Page 112: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 96

Figura 58. Consultar datos mediante servicio web REST, captura de pantalla del sistema SoapUI, por el

autor (2019)

Figura 59. Eliminar datos mediante servicio web REST, captura de pantalla del sistema SoapUI, por el

autor (2019)

Page 113: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 97

3.3.3 Prueba de integración con el sistema SIDD

3.3.3.1 Ingreso de archivo

Figura 60. Formulario de caso de prueba ingreso de archivo desde sistema SIDD, Investigación directa, por

el autor (2019)

Page 114: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 98

Figura 61. Contenido de documento JSON, información tomada del aplicativo fauxton, por el autor, (2019)

En la figura 61 se puede observar el contenido del documento JSON creado desde el

sistema SIDD, en el cual se puede observar que la información registrada efectivamente

hace referencia a los datos del caso de prueba insertar documentos.

Cabe indicar que el sistema fauxton también permite descargar los archivos adjuntos de

los registros, tal como se puede observar en la figura 61.

Page 115: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 99

3.3.3.2 Descargar archivo desde el sistema SIDD

Figura 62. Formulario de caso de prueba descarga de archivo desde sistema SIDD, Investigación directa,

por el autor (2019)

Page 116: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 100

Figura 63. Descarga de archivo desde el sistema SIDD, información tomada del Sistema de Digitalización

de Documentos, por el autor (2019)

Page 117: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 101

3.3.3.3 Eliminar documentos desde el sistema SIDD

Figura 64. Formulario de caso de prueba eliminar documento desde el sistema SIDD, Investigación directa,

por el autor (2019)

Page 118: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 102

Figura 65. Eliminar documento desde el sistema SIDD, Información tomada del aplicativo fauxton, por el

autor (2019)

Como se evidenciar en las imágenes de pruebas, se corrobora que luego de la ejecución

de cada operación, en los documentos dentro de la base de datos couchDB hubo un cambio

relacionado con los datos enviados en el evento que originó la modificación.

Por lo anteriormente expuesto en cada una de las pruebas, queda demostrado que la base

de datos SIDD en couchDB permite de manera totalmente efectiva insertar, descargar y

eliminar los documentos digitalizados de los clientes de la empresa Generali Ecuador Cía.

de Seguros S.A. Y de la misma manera mediante la integración con el sistema SIDD queda

confirmado que la base de datos anteriormente nombrada se puede integrar con los demás

sistemas de la compañía, por medio del consumo de los servicios web REST que en ella se

integran de forma nativa.

3.4 Conclusión y recomendación

3.4.1 Conclusiones

Luego de implementar el sistema de base de datos NoSQL como medio para el

almacenamiento y centralización de documentos digitales, se puede concluir que estas

bases de datos son muy complejas de manejar, debido a que carecen de un lenguaje

Page 119: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 103

estructurado de consulta claramente definido y que además no existe un estándar en la

manipulación de los datos, es decir en el manejo de los datos cada sistema NoSQL es

diferente uno de otro.

Haber elegido couchDB fue una decisión muy acertada debido a que:

Permite cargar los archivos digitales como adjuntos de los documentos JSON de la

base de datos, esta es una característica presente solamente esta base de datos y que

resulta de gran ayuda para proyectos con características similares al presente trabajo.

El acceso y operaciones a los datos se realiza mediante servicios web REST, los cuales

puede ser consumidos mediante la librería CURL, que es bastante difundida y

soportada en el ambiente informático, lo que facilitó en gran medida a la

implementación de este proyecto.

Se puede alcanzar un gran poder de cómputo, distribuyendo los procesos en diferentes

computadoras.

También se puede concluir que la información converge en un solo punto, lo cual

significa un gran avance en la organización documental, gracias a esto es más fácil

encontrar una información requerida, en lugar de buscar entre ciento de carpetas

distribuida por varios servidores.

Otro punto a considerar es la utilización de RAD como metodología de desarrollo de

proyectos relacionados a la implementación de base de datos, pues no cabe la menor duda

que es una excelente herramienta que debido a su flexibilidad permite concentrar todos sus

componentes para gestionar un proyecto de tales características.

3.4.2 Recomendaciones

Se recomienda el uso de la base de datos couchDB en el desarrollo de sistemas

informáticos para la gestión de documentos digitales. Debido su fácil instalación y

configuración, no requieren que grandes máquinas para ofrecer un excelente rendimiento,

además contar con una excelente documentación online y de tener el soporte de Apache

Org.

Page 120: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Propuesta 104

También se recomienda ampliamente implementar sistemas documentales que permitan

centralizar el almacenamiento documental de las empresas y que agilicen la gestión de los

mismos.

Se recomienda el uso de RAD como metodología o marco de trabajo en proyectos de

diseño o implementación de base de datos, por el motivo que facilita en gran medida

brinda sustento técnico a proyecto similar o a proyectos que no necesariamente requieren

de programación.

Page 121: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

ANEXOS

Page 122: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Anexos 106

ANEXOS Nº 1

ENTREVISTAS

Entrevista # 1

Nombre del Encuestado

Ing. Rodrigo Pazos Fecha de la entrevista

04/07/2019

Cargo que desempeña:

Administrador del centro de computo

1. ¿Qué base de datos se utiliza para almacenar la información del sistema SIDD? Para guardar los datos se utiliza sistema de base de datos de MySql.

2. ¿Con que periodicidad se realizan respaldos de los datos? Todos los días se respaldan los datos de todos los sistemas, incluido el SIDD.

3. ¿Cuáles son los pasos a realizar en la elaboración del proceso de respaldo? Para respaldar los datos del SIDD se hace un proceso diferente al resto de sistemas ya que son datos de tipo binario. Lo que se hace es respaldar el directorio en donde MySql guarda los datos. Para el resto de sistemas se ejecuta el comando mysqldump.

4. ¿Qué tiempo se toma realizar el proceso de respaldo del SIDD? Actualmente toma un tiempo aproximado de 8 horas.

5. ¿Actualmente cuánto pesa la base de datos SIDD? Actualmente pesa un poco más 83 Gigas, pero 82 GB están concentrados en una sola tabla que es la que almacena las imágenes.

6. ¿Quiénes son los responsables de realizar los respaldos del SIDD? Únicamente yo soy el responsable de realizarlo.

7. ¿Considera usted necesario cambiar la base de datos del SIDD y por qué? Sí, porque MySql no es una base de datos robusta como para gestionar grandes volúmenes de datos. Ni gestionar adecuadamente los datos de tipo binarios y una muestra de ello es que no se puede respaldar los datos con el comando mysqldump.

8. ¿Qué características considera que debería tener la nueva base de datos del SIDD? Nativamente debería contener lo siguiente: Manejar grandes volúmenes de datos. Orientada al manejo de archivos. Permitir replicación. Permitir escalabilidad horizontal

Page 123: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Anexos 107

Entrevista # 2

Nombre del Encuestado

Ing. Carlos Silva Fecha de la entrevista

04/07/2019

Cargo que desempeña:

Subgerente de TI

1. ¿Administrativamente considera viable mantener la actual base de datos? No, por el motivo que consume mucho tiempo administrar esa base de datos, tiempo que puede ser utilizado en otras tareas más prioritarias.

2. ¿Alguna vez ha tenido problema con la base de dato del SIDD? Si, en dos ocasiones una misma tabla genero error “tabla corrupta” teniendo que recuperar los datos de un respaldo y volviendo a reingresar las imágenes del último día.

3. ¿Qué tanto se está considerando cambiar la base de datos del SIDD? En la actualidad es una prioridad realizar ese cambio, por el motivo que es complicado administrar esa base de datos y por el peso que tiene la base de datos. Lo que está volviendo lento el sistema SIDD. Cambiar la base de datos por una base de datos más robusta y con mejores prestaciones me permitirá estar más tranquilo. Porque sabré que los datos estarán a buen recaudo.

4. ¿Qué características considera que debería tener la nueva base de datos del SIDD? La nueva base de deber tener las características de las bases de datos modernas como la alta disponibilidad, replicación y sobre todo manejar el concepto de big-data.

Page 124: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Anexos 108

Entrevista # 3

Nombre del Encuestado

Sr. Johan Beltrán Fecha de la entrevista

05/07/2019

Cargo que desempeña:

Ejecutiva de cumplimiento

1. ¿Con que periodicidad utiliza el sistema SIDD? Utilizó el sistema SIDD todos los días para registrar la documentación de los clientes.

2. ¿Aproximadamente cuantas imágenes registra diariamente? Según los registros, se ingresan un promedio de 45 imágenes al día.

3. ¿En la siguiente escala indique que tan fácil considera que es usar el sistema SIDD? a: Fácil b: No tan fácil c: Complicado Es fácil.

4. ¿Si pudiera cambiar algo del sistema, que sería? Cambiaría la velocidad del sistema, al principio el sistema funcionaba muy bien era rápido, pero actualmente se tarda mucho al consultar grabar o eliminar las imágenes.

5. ¿Considera usted necesario cambiar la base de datos del SIDD y por qué? Sí y por qué MySql no es una base de datos robusta como para gestionar grandes volúmenes de datos. Ni gestionar adecuadamente los datos de tipo binarios y una muestra de ello es que no se puede respaldar los datos con el comando mysqldump.

6. ¿Qué características considera que debería tener la nueva base de datos del SIDD? Nativamente debería contener lo siguiente: Manejar grandes volúmenes de datos. Orientada al manejo de archivos. Permitir replicación. Permitir escalabilidad horizontal

Page 125: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Bibliografía 109

BIBLIOGRAFÍA

Generali Ecuador Cía. de Seguros S.A. (2012). Manual de prevención de lavado de activos

y financiamiento del terrorismo y otros delitos. Obtenido de

http://generali.com.ec/archivos/pres_27.pdf

Decreto Supremo N° 1147. Legislación sobre contratos de seguros. Registro Oficial de la

República del Ecuador, Quito, 07 de diciembre de 1963

Ley General de Seguros. Registro Oficial de la república de Ecuador, Quito, 12 de

septiembre del 2014

Fundación Mapfre. (2012). Diccionario Mapfre de seguros. Obtenido de

https://www.fundacionmapfre.org/fundacion/es_es/publicaciones/diccionario-

mapfre-seguros/s/seguro.jsp

Unidad de Análisis Financiero y Económico. (2012). Infórmate sobre el lavado de activos.

Obtenido de https://www.uafe.gob.ec/informate-sobre-el-lavado-de-activos/

Martin, R., Manuel, H., & Ariza Quiroga, D. A. (2016). Implementación de Prototipo de

Software de Gestión de Información y Procesos para Oficina Asesora de Seguros

Basada en Tecnologías CLOUD.

Zhingri, V., & Augusto, C. (2016). Análisis de rendimiento entre la base de datos

relacional: MySQL y una base de datos no relacional: MongoDB (Bachelor's

thesis, Universidad del Azuay).

Antaño, A. C. M., Castro, J. M. M., & Valencia, R. E. C. (2014). Migración de Bases de

Datos SQL a NoSQL. Revista Tlamati, Especial, 3, 144-148.

Vieira, M. R., FIGUEIREDO, J. M. D., Liberatti, G., & Viebrantz, A. F. M. (2012).

Bancos de Dados NoSQL: conceitos, ferramentas, linguagens e estudos de casos no

contexto de Big Data. Simpósio Brasileiro de Bancos de Dados.

Zuleta Sevilla, N. E. (2018). Estudio de la integración del lenguaje de programación PHP

con la base de datos NOSQL apache COUCHDB Sistema de gestión de expedientes

de los estudiantes de la carrera de Ingeniería en Sistemas

Computacionales (Bachelor's thesis).

Silva, B., Felipe, J., & Chicaiza Ayala, P. A. (2006). Diseño de una solución SAN para la

centralización de la información de la Escuela Politécnica Nacional (Bachelor's

thesis, QUITO/EPN/2006).

Cevallos, J. R. M., & Holguín, B. L. D. (2018). Sistemas de información empresarial: la

información como recurso estratégico. Dominio de las Ciencias.

Sánchez-Vignau, B. S., & Valdés-López, Y. (2008). Diseño de sistemas de información

documental. Consideraciones teóricas. Ciencias de la Información.

Núñez Quiroz, J. J. (2019). Adquisición e implementación de un sistema de digitalización

de documentos y gestión documental.

Page 126: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Bibliografía 110

Martín, A. E., Chávez, S. B., Rodríguez, N. R., Valenzuela, A., & Murazzo, M. A. (2013,

June). Bases de datos NoSQL en cloud computing. In XV Workshop de

Investigadores en Ciencias de la Computación.

Sánchez, A. E. (2014). La gestión de documentos como estrategia de innovación

empresarial. Enl@ce: Revista Venezolana de Información, Tecnología y

Conocimiento, 11(2), 25-50.

Mesa, E. G. (2015). La digitalización de documentos, ¿amiga o enemiga?. Bibliotecas.

Anales de Investigación, (2), 150-154.

Couchbase. (2019). Why NoSQL? Couchbase, Recuperado el 20 de Julio de 2019, de

https://www.couchbase.com/resources/why-nosql

Antiñanco, M. J. (2014). Bases de Datos NoSQL: Escalabilidad y alta disponibilidad a

través de patrones de diseño (Doctoral dissertation, Facultad de Informática).

Moyano González, A. D. (2019). Sistema de transferencia de datos de origen múltiple a

Oracle para la empresa Solinfo (Bachelor's thesis, Universidad Técnica de

Ambato. Facultad de Ingeniería en Sistemas, Electrónica e Industrial. Carrera de

Ingeniería en Sistemas Computacionales e Informáticos).

Tran, M. C., & Nakamura, Y. (2016, January). Classification of HTTP automated software

communication behaviour using NoSql database. In 2016 International Conference

on Electronics, Information, and Communications (ICEIC) (pp. 1-4). IEEE.

tic. Portal. (2016). Sistema de Gestión Documental. Obtenido de

https://www.ticportal.es/temas/sistema-gestion-documental/que-es-sistema-gestion-

documental

Sánchez, A. (2007). El valor del cliente como herramienta estratégica de gestión en un

mercado industrial. Málaga: Universidad de Málaga.

Pulgar-Rubio, F., Carmona, C. J., Rivera-Rivas, A. J., González, P., & del Jesus, M. J.

(2015). Una primera aproximación al descubrimiento de subgrupos bajo el

paradigma MapReduce. In 1er Workshop en Big Data y Análisis de Datos

Escalable (pp. 991-1000).

Eduardo Fabián Cajas Malavé, (2014) Estudio Sobre Las Bases De Datos Nosql Orientado

A Los Servicios Web 2.0.

Montoya, C. E. G., Uribe, C. A. C., & Rodríguez, L. E. S. (2014). Seguridad en la

configuración del servidor web Apache. Inge Cuc, 9(2), 31-38.

Romano, J. M. G. (2015). Desarrollo de sitios web con PHP y MySQL. Obtenido de

http://www. lsi. us. es/cursos/cursophp/apuntes/tema1. pdf.

Page 127: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Bibliografía 111

Mora-Castillo, J. A. (2016). Serialización/deserialización de objetos y transmisión de datos

con JSON: una revisión de la literatura. Revista Tecnología en Marcha, 29(1), ág-

18.

Página oficial de CURL, Obtenido el 30 de julio de 2019, de https://curl.haxx.se

Página oficial de PHP, Obtenido el 30 de julio de 2019, de

https://www.php.net/manual/es/curl.examples.php

Página oficial de couchDB, Obtenido el 30 de julio de 2019, de http://couchdb.apache.org

Letelier, P., & Penadés, M. C. (2012). Metodologías ágiles para el desarrollo de software:

eXtreme Programming (XP).

PERUGACHI, P., & PAÚL, S. (2017). PLAN DE MEJORA DE LA CUSTODIA Y

ADMINISTRACIÓN CENTRALIZADA DE DOCUMENTOS SENSIBLES EN

LA COOPERATIVA DE AHORRO Y CRÉDITO CONSTRUCCIÓN,

COMERCIO Y PRODUCCIÓN (Bachelor's thesis, Quito).

López Ramírez, M. C. (2015). Diseño e implementación de una base de datos para

recogida y análisis de datos de actividad física provenientes de dispositivos

wearables.

Puerta González, J. M. (2015). Desarrollo de una API para la descripción y gestión de

Servicios Web REST.

Cárdenas Ospina, L. A., & Rodríguez Beltrán, J. A. (2016). Sistema de gestión de pruebas

para productos de software.

Jerez Mayorga, D. S. (2017). Análisis de métodos, técnicas y herramientas de Verificación

y validación de software, aplicados en la Dirección de Tecnología de Información y

Comunicación de La Universidad Técnica de Ambato (Bachelor's thesis).

Urbina, G. B. (2016). Introducción a la seguridad informática. Grupo editorial PATRIA.

García-Canal, E., Rialp-Criado, A., & Rialp-Criado, J. (2015). Tecnologías de la

información y comunicación (TIC) y crecimiento de la empresa. ICE, Revista de

Economía, (838).

Chaverra, J. A. H., & Arias, A. V. (2017). El papel de las TIC en el entorno organizacional

de las pymes. Trilogía Ciencia Tecnología Sociedad, 4(7), 105-122.

Sánchez, J. C. (2012). Los métodos de investigación. Ediciones Díaz de Santos.

Date, C. J. (2001). Introducción a los sistemas de bases de datos. Pearson Educación.

Rivero, D. (2013). Metodología de la investigación.

Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2003). Metodología

de la investigación (Vol. 707). México: McGraw-Hill.

Page 128: UNIVERSIDAD DE GUAYAQUIL FACULTAD DE ...repositorio.ug.edu.ec/bitstream/redug/47016/1/Tesis...1.4.3 Sistemas de bases de datos distribuidas 23 1.4.4 Sistemas de almacenamiento Not

Bibliografía 112

Arias, F. G. (1999). El proyecto de investigación. Fidias G. Arias Odón.

Gamboa, J. Z. (2018). Evolución de las Metodologías y Modelos utilizados en el

Desarrollo de Software. INNOVA Research Journal, 3(10), 20-33.

Ojeda, J. C., & Fuentes, M. D. C. G. (2012). Taxonomía de los modelos y metodologías de

desarrollo de software más utilizados. Universidades, (52), 37-47.

Gallego, M. T. (2012). Metodología Scrum. Universitat Oberta de Catalunya.

Caballero Narvaez, S., & Devia Palacio, D. S. (2018). Sistema de información

bibliotecario para la Biblioteca Manuela Beltrán.

Torres, P. L. (2004). Desarrollo de Software Orientado a Objeto usando UML. Universidad

Politecnica de Valencia (UPV)–España.

García-Holgado, A., García, M., & García-Peñalvo, F. J. (2018). UML. Unified Modeling

Language.

Danhke, L. (1989). Metodología y técnicas de la investigación.

Flores, J., García, E., & Rodríguez, G. (1996). Metodología de la investigación cualitativa.

Málaga: Editorial Aljibe