estrategias para la gestiÓn de grandes volumenes de …

110
ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE DATOS POR MEDIO DE BIG DATA EN EL CONTEXTO DE LA ANALITICA DE NEGOCIOS: CASO MVM INGENIERÍA DE SOFTWARE S.A.S Esneyder Ardila Cañas Isabel Cristina Gómez Díaz Universidad de San Buenaventura Especialización en Gestión de Información y Bases de Datos Cohorte 7 Medellín 2014

Upload: others

Post on 25-Jul-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE DATOS POR MEDIO DE BIG DATA EN EL CONTEXTO DE LA

ANALITICA DE NEGOCIOS: CASO MVM INGENIERÍA DE SOFTW ARE S.A.S

Esneyder Ardila Cañas Isabel Cristina Gómez Díaz

Universidad de San Buenaventura Especialización en Gestión de Información y Bases de Datos

Cohorte 7 Medellín

2014

Page 2: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE DATOS POR MEDIO DE BIG DATA EN EL CONTEXTO DE LA

ANALITICA DE NEGOCIOS: CASO MVM INGENIERÍA DE SOFTW ARE S.A.S

Esneyder Ardila Cañas Isabel Cristina Gómez Díaz

Trabajo de Grado para optar al Título de Especialista en Gestión de Información y Bases de Datos

Asesor ING.ESP. MSC. RICARDO ALONSO GALLEGO BURGOS

Universidad de San Buenaventura Especialización en Gestión de Información y Bases de Datos

Cohorte 7 Medellín

2014

Page 3: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

Nota de aceptación

____________________________

Firma

Nombre:

Presidente del jurado

Firma

Nombre:

Jurado

Firma

Nombre:

Jurado

Medellín, 28 de Abril de 2014

Page 4: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

AGRADECIMIENTOS

Aquellas personas que estuvieron durante todo esta proceso pendientes de mi avance convirtiéndose en un apoyo que me ayudo a terminar con éxito este logro profesional.

Isabel Cristina Gómez Díaz

A Dios por darme la fuerza y voluntad de terminar esta nueva etapa de mi vida que me hace crecer como profesional y persona, en segundo lugar a mi mamá, mi abuela y mi abuelo, quienes desde el cielo han estado conmigo y me han bendecido en cada etapa de mi vida. A mi familia quienes desde la distancia han estado conmigo brindando su apoyo incondicional, a ellos le agradezco todo lo que han hecho por mí. También me gustaría agradecer a mis profesores porque todos han aportado con un granito de arena a mi formación, también le agradezco mucho a mi compañera Isabel Gómez quien con su paciencia, espontaneidad y compañerismo realizamos un buen equipo para terminar este y otros trabajos. Y por último a mis amigos quienes han tenido una voz de aliento cada vez que los necesito.

Esneyder Ardila Cañas

A nuestro asesor Msc. Ricardo Alonso Gallego Burgos por el conocimiento compartido y transmitido en el desarrollo de esta investigación, por su disposición durante este tiempo y por su exigencia en crear un trabajo bien estructurado, con los lineamientos requeridos y resultados concretos.

A nuestro asesor José Eucario Parra Castrillón por asesorarnos metodológicamente en gran parte del trabajo para presentar un proyecto con éxito.

Page 5: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

CONTENIDO

INTRODUCCION

CAPITULO 1. MARCO METODOLOGICO ............................................................. 1

_1.1 Planteamiento Del Problema .................................................................................... 1

_1.2 Justificación .............................................................................................................. 2

_1.3 Pregunta De Investigación ........................................................................................ 3

_1.4 Objetivos De La Investigación ................................................................................. 3

__1.4.1 Objetivo General ................................................................................................ 3

__1.4.2 Objetivos Específicos ........................................................................................ 3

_1.5 Alcance ..................................................................................................................... 3

_1.6 Metodología .............................................................................................................. 4

CAPITULO 2. MARCO CONCEPTUAL ................................................................... 9

_2.1 Definiciones Generales ............................................................................................. 9

__2.1.1 ¿Que son las Bases de Datos?.............................................................................. 9

__2.1.2 ¿Qué son los Datos? .......................................................................................... 10

__2.1.3 ¿Qué es la Información? .................................................................................... 11

_2.2 TIC’S: Tecnologías de la Información y Comunicación ........................................ 11

_2.3 Gestión de la Información ...................................................................................... 13

__2.3.1 Herramientas para la Gestión de la Información ............................................... 17

_2.4 Inteligencia de Negocios (BI) ................................................................................. 19

_2.5 Big Data .................................................................................................................. 24

__2.5.1 Aplicaciones de Big Data .................................................................................. 29

__2.5.2 Modelos de Negocio Big Data........................................................................... 31

__2.5.3 Metodologías Big Data ...................................................................................... 33

__2.5.4 Técnicas para el Análisis de Información Big Data .......................................... 37

_2.6 Seguridad de Información Big Data ....................................................................... 43

_2.7 Big Data Enfocada a la Inteligencia de Negocios .................................................. 45

CAPITULO 3. DIAGNOSTICO DEL ESTADO ACTUAL DE LA UNI DAD DE ANÁLISIS EN EL CONTEXTO DE LA GESTION DE GRANDES VO LUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION D E ANALITICA DE NEGOCIOS .................................................................................... 47

_3.1 Instrumento de recolección de la información ....................................................... 47

Page 6: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

_3.2 Resultados de la encuesta ....................................................................................... 48

_3.3 Análisis de resultados ............................................................................................. 54

CAPITULO 4. ESTRATEGIASPARA LA GESTION DE GRANDES VOLUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION D E ANALITICA DE NEGOCIOS EN MVM Ingeniería de Software S.A.S ................ 64

CAPITULO 5. CONCLUSIONES, LECCIONES APRENDIDAS Y RECOMENDACIONES .............................................................................................. 76

_5.1 Conclusiones ........................................................................................................... 76

_5.2 Lecciones Aprendidas............................................................................................ 78

_5.3 Recomendaciones .................................................................................................. 79

REFERENCIAS ........................................................................................................... 80

ANEXOS ....................................................................................................................... 83

Page 7: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

LISTA DE TABLAS

Tabla 1. Etapas de la Investigación ................................................................................ 5

Tabla 2. Primer Objetivo Específico del Proyecto ......................................................... 6

Tabla 3. Segundo Objetivo Específico del Proyecto ...................................................... 6

Tabla 4. Tercer Objetivo Específico del Proyecto .......................................................... 7

Tabla 5. Definiciones de Bases de Datos ...................................................................... 10

Tabla 6. Definiciones de Datos ..................................................................................... 10

Tabla 7. Definiciones de Información .......................................................................... 11

Tabla 8. Definiciones de TIC’S .................................................................................... 12

Tabla 9. Definiciones de Gestión de Información ........................................................ 13

Tabla 10. Herramientas de Gestión de la Información ................................................. 17

Tabla 11. Definiciones de Inteligencia de Negocios .................................................... 19

Tabla 12. Aplicaciones Inteligencia de Negocios ......................................................... 22

Tabla 13. Definiciones de Big Data .............................................................................. 24

Tabla 14. Características de Big Data .......................................................................... 26

Tabla 15. Hitos Analítica de Negocios ......................................................................... 27

Tabla 16. Ejemplos de Aplicaciones de Big Data ........................................................ 28

Tabla 17. Aplicaciones de Big Data ............................................................................. 29

Tabla 18. Modelos de Negocio Big Data ..................................................................... 32

Tabla 19. Metodologías Big Data ................................................................................. 33

Tabla 20. Técnicas para el Análisis de Información Big Data ..................................... 38

Tabla 21. Ficha Técnica Encuesta ................................................................................ 48

Tabla 22. Análisis de los resultados ............................................................................. 56

Tabla 23. Hallazgos Identificados del Análisis a la Encuesta ...................................... 60

Tabla 24. Planteamiento de Estrategias ........................................................................ 66

Tabla 25. Descripción de Roles .................................................................................... 71

Tabla 26. Falencias Identificadas y Estrategias de Solución ........................................ 73

Page 8: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

LISTA DE ILUSTRACIONES

Ilustración 1. Ciclo de Gestión de la Información. ....................................................... 16

Ilustración 2. Fases de la Inteligencia de Negocios ...................................................... 21

Ilustración 3. Modelo de Negocio Big Data ................................................................. 31

Ilustración 4. Pasos Metodología ICAV ....................................................................... 36

Ilustración 5. Big Data Consulting Methodology ......................................................... 36

Ilustración 6. CBIG Framework ................................................................................... 37

Ilustración 7. Metodología de la Compañía Business Rio ............................................ 37

Ilustración 8. Estrategias ............................................................................................... 65

Page 9: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

LISTA DE ANEXOS

Anexo A. Encuesta 84

Page 10: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

GLOSARIO

ANÁLISIS: Distinción y separación de las partes de un todo hasta llegar a conocer sus

principios o elementos (Diccionario Real Academia, 2001).

ANALITICA DE NEGOCIOS: Conjunto de herramientas de software y aplicaciones de

mercado, que permiten agregar, administrar, organizar, analizar, accesar y entregar datos

estructurados y no estructurados (Worldwide Business Analytics Software, 2012).

BENEFICIO: El beneficio es un concepto positivo pues significa dar o recibir algún bien,

o sea aquello que satisface alguna necesidad (Diccionario Real Academia, 2001).

BASE DE DATOS: Es el conjunto de informaciones almacenadas en un soporte legible por

ordenador y organizadas internamente por registros (formado por todos los campos referidos

a una entidad u objeto almacenado) y campos (cada uno de los elementos que componen un

registro). Permite recuperar cualquier clase de información: referencias, documentos

textuales, imágenes, datos estadísticos, etc. (Pinto, 2011).

BIG DATA: Es la tendencia en el avance de la tecnología que ha abierto las puertas hacia

un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir

enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que

tomaría demasiado tiempo y sería muy costoso cargarlos a una base de datos relacional para

su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información

que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales

(Barranco, 2012).

CLOUD COMPUTING : Entorno en el que es posible almacenar diferentes tipos de

contenido o aplicaciones, sin tener que disponer de una infraestructura propia que lo

mantenga. Es la posibilidad de utilizar servicios en la Red sin disponer de la estructura

necesaria que hace falta para mantener y ofrecer este tipo de servicio (Oliver, 2012).

COMPORTAMIENTO: Se considera como comportamiento todo lo que el individuo hace

o dice, independientemente de que sea o no observable. Segundo, aunque todo

comportamiento implica necesariamente actividad biológica del organismo, no es reductible

Page 11: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

a dicha actividad biológica. Tercero, los estados biológicos del organismo y la actividad

reactiva propia de sus células o sistemas, no deben considerarse como un fenómeno

psicológico. Cuarto, el comportamiento implica siempre la actividad del individuo en

relación con el medio (que puede ser el propio organismo o el entorno físico o social), por

lo que no puede definirse ni comprenderse si se reduce exclusivamente a la actividad o

respuesta del organismo. Y quinto, la relación que se establece entre la actividad del

organismo y su medio es variable (Fernandez, 1997).

ESTRATEGIA : Conjunto de acciones planificadas sistemáticamente en el tiempo que se

llevan a cabo para lograr un determinado fin o misión (Magana, 2013).

HERRAMIENTA: Subprograma o módulo encargado de funciones específicas y afines

entre sí para realizar una tarea. Una aplicación o programa puede contar con múltiples

herramientas a su disposición. Por ejemplo, el corrector ortográfico puede ser una

herramienta en una aplicación para redactar documentos, pero no es una aplicación en sí

misma (Alegsa, 1998).

INFORMACIÓN: La información es un conjunto de datos acerca de algún suceso, hecho

o fenómeno, que organizados en un contexto determinado tienen su significado, cuyo

propósito puede ser el de reducir la incertidumbre o incrementar el conocimiento acerca de

algo (Thompson, 2008).

INFORMACION NO ESTRUCTURADA : Toda aquella información electrónica creada

u obtenida por los usuarios finales que no es almacenada en tablas de bases de datos

relacionales: puede incluir e-mails, documentos ofimáticos, pdf, hojas de cálculo,

presentaciones, documentos gráficos, audiovisuales, etc. (Garcia, 2013).

INTELIGENCIA DE NEGOCIOS: Es una estrategia empresarial que persigue

incrementar el rendimiento de la empresa o la competitividad del negocio, a través de la

organización inteligente de sus datos históricos (transacciones u operaciones diarias),

usualmente residiendo en Data Warehouse corporativos o Data Marts departamentales

(López, 2013).

Page 12: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

INTERNET: Es una gran red internacional de ordenadores. Permite, como todas las redes,

compartir recursos. Es decir: mediante el ordenador, establecer una comunicación inmediata

con cualquier parte del mundo para obtener información sobre un tema que nos interesa, ver

los fondos de la Biblioteca del Congreso de los Estados Unidos, o conseguir un programa o

un juego determinado para nuestro ordenador. En definitiva: establecer vínculos

comunicativos con millones de personas de todo el mundo, bien sea para fines académicos

o de investigación, o personales (Cuadra, 2003).

INVESTIGACIÓN: Es un procedimiento reflexivo, sistemático, controlado y crítico que

tiene por finalidad descubrir o interpretar los hechos y fenómenos, relaciones y leyes de un

determinado ámbito de la realidad...-una búsqueda de hechos, un camino para conocer la

realidad, un procedimiento para conocer verdades parciales,-o mejor-, para descubrir no

falsedades parciales (Ander, 1992).

IT: (Tecnologías de la información) Concepto que abarca todo lo relacionado a la

conversión, almacenamiento, protección, procesamiento y transmisión de la información. El

concepto se emplea para englobar cualquier tecnología que permite administrar y

comunicar información (Romo, 2011).

METODOLOGIA: Hace referencia al conjunto de procedimientos racionales utilizados

para alcanzar una gama de objetivos (Rangel, 2007).

MINERIA DE DATOS: Campo de las ciencias de la computación referido al proceso que

intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Este

proceso consiste en extraer información de un conjunto de datos y transformarla en una

estructura comprensible para su uso posterior (Granda, 2012).

PLATAFORMA: Es un sistema que sirve como base para hacer funcionar determinados

módulos de hardware o de software con los que es compatible. Dicho sistema está definido

por un estándar alrededor del cual se determina una arquitectura de hardware y

una plataforma de software (incluyendo entornos de aplicaciones). Al definir plataformas se

establecen los tipos de arquitectura, sistema operativo, lenguaje de programación o interfaz

de usuario compatibles (Santamaria, 2013).

Page 13: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

PREDICCIÓN: Anunciar por revelación, ciencia o conjetura algo que ha de suceder

(Diccionario Real Academia, 2001).

PROCESAMIENTO DE INFORMACIÓN: Se entienden habitualmente las técnicas

eléctricas, electrónicas o mecánicas usadas para manipular datos para el empleo humano o

de máquinas (Universidad del Cauca, 2005).

REDES SOCIALES: Las redes sociales en Internet son comunidades virtuales donde sus

usuarios interactúan con personas de todo el mundo con quienes encuentran gustos o

intereses en común. Funcionan como una plataforma de comunicaciones que permite

conectar gente que se conoce o que desea conocerse, y que les permite centralizar recursos,

como fotos y vídeos, en un lugar fácil de acceder y administrado por los usuarios mismos

(Castro, 2012).

SISTEMA: Un conjunto de entidades caracterizadas por ciertos atributos, que tienen

relaciones entre sí y están localizadas en un cierto ambiente, de acuerdo con un cierto

objetivo (Juana Rincon,1995).

SOFTWARE: Software es la suma total de los programas de computadora, procedimientos,

reglas, la documentación asociada y los datos que pertenecen a un sistema de cómputo

(Lewis, 1994).

TECNOLOGÍA: La tecnología es la suma de las mediaciones entre nosotros y el mundo

natural, y la suma de las separaciones que median entre cada uno de nosotros y el otro; toda

la explotación y toxicidad necesaria para producir y reproducir el escenario de

hiperalienación en el que languidecemos. Es la textura y la forma de la dominación en

cualquier contexto de jerarquía y comercialización (Zerzan, 2001).

TOMA DE DESICIONES: Proceso mediante el cual se realiza una elección entre las

opciones o formas para resolver diferentes situaciones de la vida en diferentes contextos

(Olivares y González, 2012).

VENTAJA: Superioridad o mejoría de alguien o algo respecto de otra persona o cosa

(Diccionario Real Academia, 2001).

Page 14: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

RESUMEN

Actualmente los volúmenes de información que genera la sociedad aumentan en gran

medida diariamente, esto debido a la incursión de nuevas tecnologías las cuales incorporan

imágenes, videos, sonidos y en general una gran cantidad de datos de tipo no estructurados,

esta situación se genera debido a causas como la incursión de redes sociales, la

implementación de transacciones comerciales y de negocios en internet, la llegada del

comercio electrónico, la creación de dispositivos móviles y la sistematización y

virtualización de actividades diarias, las cuales permiten una ágil comunicación y han

tomado fuerza en las últimas décadas siendo apalancadas por el fácil acceso a internet que

ahora se tiene y el cual con el tiempo le ha permitido a toda la sociedad interactuar de forma

rápida y optima por este medio. Para las empresas la posibilidad de obtener conocimiento a

través del análisis realizado a los datos generados por sus clientes y/o usuarios se convierte

en una ventaja competitiva ya que pueden identificar necesidades, tendencias y

comportamiento, teniendo una visión general del mercado (clientes, competidores,

proveedores, aliados, etc.), lo que significa la capacidad de una mejor toma de decisiones.

Por lo anterior, se hace importante conocer técnicas y procedimientos para la gestión de

grandes volúmenes de información, incluyendo los datos no estructurados obtenidos desde

diferentes fuentes de información internas y externas de la empresa. Por tal motivo, el

presente estudio de caso, pretende establecer Estrategias para la Gestión de Grandes

Volúmenes de Datos por Medio de Big Data en el Contexto de la Analítica de Negocios en

la organización MVM Ingeniería de Software S.A.S, buscando generar insumos para que

sean tenidos en cuenta en las soluciones que desarrolla la empresa en el contexto de la

analítica de negocios.

Palabras Clave: Datos no Estructurados, Big Data, Base de Datos, Toma de Decisiones,

Inteligencia de Negocios, Estrategia

Page 15: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

ABSTRAC

Currently the volume of information generated by the society greatly increase daily, this due

to the introduction of new technologies which incorporate images, videos, sounds and overall

a lot of data type unstructured , this situation is generated due to causes as the incursion of

social networks, the implementation of trade and business transactions on the Internet , the

advent of electronic commerce , the introduction of mobile devices and the systematization

and virtualization daily activities , which allow quick communication and have taken hold in

decades being leveraged by the easy access to internet now has and which over time has

allowed all of society interact quickly and optimal hereby . For companies can obtain

knowledge through analysis of the data generated by your customers and / or users becomes

a competitive advantage because they can identify needs, trends and behavior, taking an

overview of the market ( customers, competitors , suppliers, partners, etc.), which means the

ability to better decision making. Therefore , it is important to learn techniques and procedures

for managing large volumes of data, including unstructured data from different sources

internal and external to the enterprise. Therefore, this case study aims to establish Strategies

for Managing Large Volumes of Data by Means of Big Data in the Context of Business

Analytics in the organization MVM Software Engineering SAS , seeking to generate inputs

that are taken into account in the solutions developed by the company in the context of

business analytics.

Keywords: Unstructured data, Big Data, Database, Decision Making, Business

Intelligence, Strategy

Page 16: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

INTRODUCCION

El volumen de datos que se genera cada día en las organizaciones es muy alto, lo que está

ocasionando que las tecnologías de bases de datos actuales se están quedando obsoletas

rápidamente. La digitalización ha acelerado el crecimiento de los datos en todas las

organizaciones, sectores y economías sin excepción. La capacidad para almacenar,

consolidar y fusionar información ha hecho que numerosas empresas tecnológicas

construyan centros de datos para satisfacer una demanda que crece con fuerza (Fidelity

Worldwine Investiment, 2012).

Las bases de datos no son el único consolidado de datos con la que puede contar una

empresa, en la actualidad existe una gran variedad de fuentes de información que permiten

obtener mayores cantidades de datos que se encuentran almacenados en diferentes

estructuras y formatos, debido a esta situación han surgido nuevas tendencias para el manejo

de datos la cuales buscan satisfacer las necesidades actuales de la sociedad en cuanto al

manejo de grandes volúmenes información, una de ellas es Big Data la cual para muchos es

la evolución de la Inteligencia de Negocios (Becerril, 2013).

El nuevo paradigma de Big Data implica que las fuentes a partir de las cuales se obtiene una

visión profunda del mercado y las operaciones se han multiplicado. Los datos ya no sólo

provienen de las bases estructuradas tradicionales, si no de interfaces de usuarios, redes

sociales, foros, mensajes de texto y entornos diversos en los que los consumidores

interactúan día a día entre sí y con otros actores del mercado. En el contexto de Big Data,

las organizaciones se encuentran ante el desafío de incorporar información en crudo, sin

procesar, que se actualiza en tiempo real y que presenta una enorme complejidad (Calderale,

2012). La ventaja competitiva para las empresas está en lograr el procesamiento de esta

información para su posterior interpretación.

La información se convierte en parte fundamental de toda empresa para generar una ventaja

competitiva y alcanzar aspectos diferenciadores en el mercado. Por lo anterior, el presente

trabajo de investigación de tipo cualitativo, en donde se emplea el método de estudio de

caso, de acuerdo a lo propuesto por YIN (1989), en donde la unidad de análisis es MVM

Ingeniería de Software S.A.S., empresa del sector de las tecnologías de la información de

Page 17: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

la ciudad de Medellín, tiene como objetivo proponer estrategias para la gestión de grandes

volúmenes de información incorporando un enfoque de Big Data en el contexto de la

analítica de negocios en los proyectos que esta organización desarrolla.

De acuerdo a la metodología seleccionada, se iniciará por medio de la revisión literaria sobre

tendencias para el tratamiento de grandes volúmenes de datos para elaborar un marco

conceptual en el contexto de Big Data y Analítica de Negocios, y adicionalmente se realizará

un diagnóstico para conocer el estado actual de la unidad de análisis en relación a la gestión

de grandes volúmenes de información y posteriormente analizarlo para contrarrestar la

realidad de la empresa frente a las tendencias actuales de bases de datos. El alcance

planteado en esta investigación no abarca la implementación de las estrategias planteadas

para el mejoramiento de procesos de toma de decisiones, lo que se pretende es generar

conocimiento a través del análisis realizado y plasmado en documentos físicos.

Page 18: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

1

CAPITULO 1. MARCO METODOLOGICO

1.1 Planteamiento Del Problema El actual crecimiento de información que experimenta la sociedad presenta dificultades

en su gestión y tratamiento. Esta situación es generada ya que cada día se genera 2,9

trillones de bytes de datos, esto equivale a 5.800 millones de discos duros de ordenadores

de tamaño medio (Fidelity Worldwine Investiment, 2012). Algunas de las causas que han

originado esta dinámica, están relacionadas con el desarrollo de redes sociales, la

implementación de transacciones comerciales y de negocios en internet, la llegada del

comercio electrónico, la creación de dispositivos móviles y la sistematización y

virtualización de actividades diarias (Calderale, 2012 y Normandeau, 2013). Lo anterior

ha generado un crecimiento de la información, lo que dificulta el proceso de toma de

decisiones, el almacenamiento innecesario y la complejidad para gestionar grandes

volúmenes de información.

Las empresas se ven afectadas con esta situación ya que se hace más complejo tener una

visión global del mercado por la gran cantidad de información que se maneja y por el

formato de la misma se omiten datos que pueden ser claves para el negocio llegando a no

tener en cuenta toda la información generada desde diversas fuentes para el análisis y la

posterior toma de decisiones.

Esta situación no es ajena para MVM Ingeniería de Software S.A.S, ya que en su

portafolio de servicios, se encuentran soluciones alrededor de la analítica de negocios

para sus principales grupos de interés. Por lo cual, se hace necesario la identificación y

definición de estrategias para la gestión de grandes volúmenes de información,

incorporando los conceptos de Big Data, con los cuales puedan afrontar las limitantes

actuales en relación a la integración y gestión de fuentes de información que tienen datos

no estructurados. Dichas estrategias, se convierten en insumos que serán tenidos en cuenta

en los proyectos que desarrolla la empresa en el contexto de la analítica de negocios,

logrando así fortalecer su portafolio de servicios y soluciones, lo que significa una mayor

ventaja competitiva para la organización.

Page 19: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

2

1.2 Justificación Esta investigación se realiza debido a que en la actualidad se cuenta con una gran variedad

de fuentes de información como interfaces de usuarios, redes sociales, foros, mensajes de

texto, imágenes, videos, entre otras, las cuales generan datos de tipo no estructurado y

esta información requiere ser procesada para la posterior toma de decisiones. Por esta

situación, las empresas demandan de técnicas que les permitan el manejo de grandes

cantidades de información de este tipo con el fin de predecir el comportamiento de un

sector en especial o de una sociedad entera y así enfocar sus procesos en dar solución a

las necesidades actuales de sus clientes. Esta investigación se basa en realizar una revisión

de la literatura para la elaboración de un marco conceptual enfocado en big data como

tendencia de base de datos en el contexto de la analítica de negocios, posteriormente

generar un diagnóstico para conocer la situación actual de MVM Ingeniería de Software

S.A.S en este contexto y finalmente plantear estrategias para el manejo de grandes

volúmenes de datos para la posterior toma de decisiones.

Con el desarrollo de esta investigación MVM Ingeniera de Software S.A.S, recibirá

insumos que le permitan realizar la adecuada gestión de grandes volúmenes de

información de una forma más acertada, por medio de las estrategias que en este

documento se plantean y las cuales puedan ser implementadas en las soluciones que la

empresa desarrolla en el contexto de la Analítica de Negocios enfocándose en el

mejoramiento de los procesos de toma de decisiones. En el desarrollo de este proyecto no

se realizara la implementación de las estrategias generadas a partir de la investigación

realizada.

Este proyecto se realiza con el cuestionamiento ¿Es posible mejorar los procesos de

tratamiento de grandes volúmenes de datos estructurados y desestructurados a partir del

trabajo con Big Data en el contexto de la Analitica de Negocios para el procesamiento

de grandes volúmenes de información y toma de decisiones en empresas del sector de las

tecnologías de la información en la ciudad de Medellín? y al finalizar el desarrollo del

mismo contar con una serie de estrategias que faciliten la gestión de grandes volúmenes

de información para la toma de decisiones.

Page 20: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

3

1.3 Pregunta De Investigación

¿Qué estrategias para la gestión de grandes volúmenes de información deberá tener en

cuenta MVM Ingeniera de Software S.A.S en las soluciones de Analítica de Negocios

que desarrolle?

1.4 Objetivos De La Investigación

1.4.1 Objetivo General Proponer estrategias para la gestión de grandes volúmenes de información incorporando

un enfoque de Big Data en el ámbito de la analítica de Negocios en MVM Ingeniería de

Software S.A.S.

1.4.2 Objetivos Específicos • Identificar las principales tendencias para el tratamiento de grandes volúmenes de

datos, analítica de negocios y Big Data, para la elaboración de un marco conceptual

por medio de la revisión de la literatura, que sirva como soporte para el desarrollo de

la presente investigación.

• Realizar un diagnóstico para identificar el estado de MVM Ingeniería de Software

S.A.S en relación a la gestión de grandes volúmenes de información en las soluciones

de analítica de negocios que la empresa ofrece a sus grupos de interés.

• Establecer estrategias para la gestión de grandes volúmenes de información en las

soluciones de analítica de negocios que ofrece MVM Ingeniería de Software S.A.S, a

partir del diagnóstico realizado.

1.5 Alcance El alcance del presente trabajo de investigación consiste en proponer estrategias para la

gestión de grandes volúmenes de información para ser tenidas en cuenta en la

implementación de soluciones de Analítica de Negocios desarrolladas por MVM

Page 21: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

4

Ingeniería de Software S.A.S. No se contempla la implementación de las estrategias

propuestas.

1.6 Metodología La investigación a realizar en el desarrollo de este proyecto es de tipo exploratoria

descriptiva ya que se pretende describir de forma detallada Big Data como tendencia de

base de datos enfocada a la Inteligencia de Negocios para el procesamiento de grandes

cantidades de información y la posterior toma de decisiones, y se usara un enfoque

metodológico cualitativo ya que se requiere la búsqueda y recolección de información

para construir un análisis y plantear estrategias para el mejoramiento de procesos. Esta

metodología servirá para recolectar la información requerida en la investigación y poder

determinar resultados en el proceso de interpretación de la información.

Por lo cual, se empleara el método de estudio de casos en esta investigación, según la

definición de Yin (1989), se refiere a una investigación empírica que estudia un fenómeno

contemporáneo dentro de su contexto de la vida real, especialmente cuando los límites

entre el fenómeno y su contexto no son claramente evidentes. Una investigación de

estudio de caso trata exitosamente con una situación técnicamente distintiva en la cual

hay muchas más variables de interés que datos observacionales; y, como resultado, se

basa en múltiples fuentes de evidencia, con datos que deben converger en un estilo de

triangulación; y, también como resultado, se beneficia del desarrollo previo de

proposiciones teóricas que guían la recolección y el análisis de datos.” Para esta

investigación la unidad de análisis la compone MVM Ingeniería de Software S.A.S, por

lo cual, se va a analizar su estado actual frente a prácticas con grandes volúmenes de

información en los las soluciones de Analítica de Negocios por medio un diagnóstico

usando el instrumento de la encuesta y sus resultados se van a contrarrestar con la

información resultante producto de la revisión de la literatura que se realice y con la cual

se elabore el marco conceptual, y luego con su respectivo análisis se van a proponer

estrategias para la gestión de grandes volúmenes de información. En la Tabla 1, se

describen las etapas que se abordaran en el desarrollo de la investigación.

Page 22: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

5

Tabla 1. Etapas de la Investigación (Elaboración Propia)

Etapa Descripción Objetivo Mapeado

Elaboración de Marco Teórico

A partir de la revisión de la literatura se reúnen referentes teóricos sobre Big Data, analítica de negocios y temas afines a través de una descripción concisa que permite entender y conocer más fácilmente dichos temas, con el fin de tener conceptos que sirvan de base a la investigación a realizar.

Identificar las principales tendencias para el tratamiento de grandes volúmenes de datos, analítica de negocios y Big Data, para la elaboración de un marco conceptual por medio de la revisión de la literatura, que sirva como soporte para el desarrollo de la presente investigación.

Diagnóstico del estado actual de la unidad de análisis

Se identifica el estado actual en el que se encuentra la unidad de análisis en cuanto a la gestión de grandes volúmenes de información a través de la implementación de instrumentos como la encuesta, la cual tiene por objetivo conocer la opinión de expertos en el uso de técnicas para las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S

Realizar un diagnóstico para identificar el estado de MVM Ingeniería de Software S.A.S en relación a la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que la empresa ofrece a sus grupos de interés.

Planteamiento de estrategias

Se plantean una serie de estrategias para la optimización de procesos de gestión de grandes volúmenes de información dentro de la unidad de análisis, las cuales impacten las soluciones actuales de analítica de negocios que la empresa desarrolla mejorando los procesos de toma de decisiones.

Establecer estrategias para la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que ofrece MVM Ingeniería de Software S.A.S, a partir del diagnóstico realizado.

En la tabla 2, 3 y 4 se detallan los objetivos del proyecto y la forma como se pretenden alcanzar, mencionando las actividades, las fuentes de las cuales se obtendrán la información, las técnicas que se emplearan y los respectivos entregables de cada uno de estos.

Page 23: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

6

Tabla 2. Primer Objetivo Específico del Proyecto (Elaboración Propia)

Objetivo

Identificar las principales tendencias para el tratamiento de grandes volúmenes de datos, analítica de negocios y Big Data, para la elaboración de un marco conceptual por medio de la revisión de la literatura, que sirva como soporte para el desarrollo de la presente investigación.

Actividades Técnicas Fuentes Entregables

• Elaboración de un

marco conceptual en el contexto de Big Data e Inteligencia de Negocios para el procesamiento de información y toma de decisiones

• Investigación acerca de Big Data como tendencia de base de datos

• Investigación acerca de la Inteligencia de Negocios como herramienta de base de datos

• Investigación acerca

del aporte de Big Data a la Inteligencia de Negocios y posibles proyecto que hayan involucrado estas herramientas en conjunto

• Revisión

Documental

• Documentos

publicados en revistas científicas

• Artículos publicados en revistas

• Libros

relacionados con el tema

Marco conceptual

Tabla 3. Segundo Objetivo Específico del Proyecto (Elaboración Propia)

Objetivo

Realizar un diagnóstico para identificar el estado de MVM Ingeniería de Software S.A.S en relación a la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que la empresa ofrece a sus grupos de interés.

Actividades Técnicas Fuentes Entregables

Page 24: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

7

• Implementación y

aplicación de la encuesta como instrumento de recolección de información para conocer el estado actual de las soluciones de analítica de negocios desarrolladas por MVM Ingeniería de Software S.A.S.

• Análisis de los resultados obtenidos de la encuesta para determinar el estado y necesidades que presentan las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S.

• Encuesta

• Información

otorgada por expertos en la temática como: Directores de Proyectos, Analistas de Negocios, especialistas en gestión de la información y analítica de negocios, Especialistas de tecnología y Analistas de Información que formen parte del talento humano de MVM Ingeniería de SoftwareS.A.S.

Documento físico y/o digital donde se detalle la tabulación realizada a la encuesta ejecutada y en el cual se explique detalladamente cual es la necesidad y el estado actual que presentan las soluciones de analítica de negocios desarrolladas porMVM Ingeniería de SoftwareS.A.S

Tabla 4. Tercer Objetivo Específico del Proyecto (Elaboración Propia)

Objetivo Establecer estrategias para la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que ofrece MVM Ingeniería de Software S.A.S, a partir del diagnóstico realizado.

Actividades Técnicas Fuentes Entregables

• Análisis comparativo de la situación actual de las soluciones de analítica de negocios desarrolladas porMVM Ingeniería de SoftwareS.A.S en relación con un marco teórico enfocado en las actuales tendencias

• Revisión

Documental

• Encuestas

• Documentos

publicados en bases de datos científicas

• Libros relacionados con el tema

• Información

Documento físico y/o digital con el listado de estrategias recomendables generadas a partir del desarrollo de la investigación para la implementación en las soluciones de analítica de negocios desarrollas por

Page 25: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

8

de bases de datos

otorgada por expertos en la temática como: Directores de Proyectos, Analistas de Negocios, especialistas en gestión de la información y analítica de negocios, Especialistas de tecnología y Analistas de Información que formen parte del talento humano de MVM Ingeniería de SoftwareS.A.S.

MVM Ingeniería de SoftwareS.A.S

Page 26: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

9

CAPITULO 2. MARCO CONCEPTUAL

En el presente capítulo se elabora el marco conceptual, de acuerdo a lo descrito en la

metodología propuesta en el numeral número 1.6 de este documento, en el cual se

describen las etapas a seguir para el desarrollo de la investigación.

En este capítulo se realiza la investigación acerca de Big Data como tendencia de base de

datos para la gestión de grandes volúmenes de datos obtenidos desde diferentes fuentes

de información. En la primera parte se identifican los principales conceptos sobre bases

de datos, tecnologías de la información, gestión de la información, inteligencia de

negocios y big data, posteriormente se detallan temas base para la investigación

mencionando sus principales características y aplicaciones como lo son las tecnologías

de la información y la inteligencia de negocios, y finalmente se describen y detallan los

principales aspectos de Big Data, características, campos de trabajo, metodologías y

técnicas de trabajo bajo esta tendencia de base de datos, además de la aplicabilidad que

tiene esta tendencia enfocada en la inteligencia de negocios.

2.1 Definiciones Generales

Las definiciones generales se enfocan en aclarar términos de uso común en el desarrollo

de la investigación y los cuales forman la base para entender las temáticas más relevantes

para el desarrollo de la investigación.

2.1.1 ¿Que son las Bases de Datos? Las bases de datos son una serie de datos organizados y relacionados entre sí, los cuales

son recolectados y explotados por los sistemas de información de una empresa o negocio

en particular (Valdés, 2007). En la Tabla 5, se describen otras definiciones relacionadas

con Bases de Datos.

Page 27: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

10

Tabla 5. Definiciones de Bases de Datos (Elaboración propia)

Definición Autor

Colección o depósito de datos, donde los datos están lógicamente relacionados entre sí, tienen una definición y descripción comunes y están estructurados de una forma particular. Una base de datos es también un modelo del mundo real y, como tal, debe poder servir para toda una gama de usos y aplicaciones

(Conference Statisticiens

Européens, 1977)

Conjunto estructurado de datos registrados sobre soportes accesibles por ordenador para satisfacer simultáneamente a varios usuarios de forma selectiva y en tiempo oportuno

(Delobel, 1982)

Es una herramienta para recopilar y organizar información, una base de datos es una serie de datos organizados y relacionados entre sí, los cuales son recolectados y explotados por los sistemas de información de una empresa o negocio en particular

(Pérez, 2007)

Se define como un conjunto organizado e integrado de datos que obedece a un modelo relacional. Este modelo permite almacenar, consultar, utilizar y compartir cualquier cantidad de información permitiendo integridad, seguridad, concurrencia y accesibilidad de la misma

(Trejo, 2012)

2.1.2 ¿Qué son los Datos? Un dato es la unidad de descripción de un hecho, dispuesta de manera adecuada para su

tratamiento (Fernández, 2008).En la tabla 6, se describen otras definiciones relacionadas

con Datos.

Tabla 6. Definiciones de Datos (Elaboración propia)

Definición Autor

Un dato es un antecedente o fundamento que permite llegar más fácilmente al conocimiento de una cosa, el cual por sí mismo no tiene relevancia alguna.

(Hernández, 2005)

Un dato es un conjunto discreto, de factores objetivos sobre un hecho real o bien un registro de transacciones que por sí mismo tiene poca o ninguna relevancia o propósito.

(Hernández, 2005)

Los datos son números, letras o símbolos que describen objetos, condiciones o situaciones. Son el conjunto básico de hechos referentes a una persona, cosa o transacción de interés para distintos objetivos, entre los cuales se encuentra la toma de decisiones.

(Dip, 2009)

Page 28: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

11

El dato es una representación simbólica (numérica, alfabética, algorítmica, etc.), una tributo o una característica de una entidad. El dato no tiene valor semántico (sentido) en sí mismo, pero si recibe un tratamiento (procesamiento) apropiado, se puede utilizar en la realización de cálculos o toma de decisiones.

(Tenjay, 2011)

2.1.3 ¿Qué es la Información? La información es un conjunto de datos acerca de algún suceso, hecho, fenómeno o

situación (Thompson, 2008). En la tabla 7, se describen otras definiciones relacionadas

con este concepto.

Tabla 7. Definiciones de Información (Elaboración propia)

Definición Autor

La información es un conjunto de mecanismos que permiten al individuo retomar los datos de su ambiente y estructurarlos de una manera determinada, de modo que le sirvan como guía de acción.

(Paoli, 1989)

La información es un conjunto de datos acerca de algún suceso, hecho o fenómeno, que organizados en un contexto determinado tienen su significado, cuyo propósito puede ser el de reducir la incertidumbre o incrementar el conocimiento acerca de algo

(Thompson, 2008)

Es un conjunto de datos con significado, o sea que reduce la incertidumbre o que aumenta el conocimiento en algo

(Chiavenato, 2009)

La información consiste en datos ordenados y seleccionados con un propósito en especifico

(Kotabe, 2009)

2.2 TIC’S: Tecnologías de la Información y Comunicación Las tecnologías de la información y la comunicación son el conjunto de tecnologías que

permiten la adquisición, producción, almacenamiento, tratamiento, comunicación,

registro y presentación de las información (Fundesco, 1986). En la tabla 8, se describen

otras definiciones relacionadas con las Tecnologías de la Información y la Comunicación

Page 29: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

12

Tabla 8. Definiciones de TIC’S (Elaboración propia)

Definición Autor

Conjunto de tecnologías que permiten la adquisición, producción, almacenamiento, tratamiento, comunicación, registro y presentación de informaciones, en forma de voz, imágenes y datos contenidos en señales de naturaleza acústica, óptica o electromagnética.

(Guarín, 2010)

Son herramientas teórico conceptuales, soportes y canales que procesan, almacenan, sintetizan, recuperan y presentan información de la forma más variada

(López, 2011)

Son el conjunto de tecnologías desarrolladas para gestionar información y enviarla de un lugar a otro. Abarcan un abanico de soluciones muy amplio. Incluyen las tecnologías para almacenar información y recuperarla después, enviar y recibir información de un sitio a otro, o procesar información para poder calcular resultados y elaborar informes

(Ruiz, 2012)

Son aquellas herramientas computacionales e informáticas que procesan, sintetizan, recuperan y presentan información representada de la más variada forma. Es un conjunto de herramienta, soportes y canales para el tratamiento y acceso a la información, para dar forma, registrar, almacenar y difundir contenidos digitalizados.

(Centro de telemedicina de Colombia, 2014)

Las Tecnologías de la Información y Comunicación (TIC’S) hacen referencia a la

utilización de medios informáticos para almacenar, procesar y difundir todo tipo de

información. Estas se encargan del estudio, desarrollo, implementación, almacenamiento

y distribución de la información mediante la utilización de hardware y software como

medio de sistema informático (Parlamento Andino, 2012). Estas tecnologías se

desarrollan a partir de los avances científicos producidos en los ámbitos de la informática

y las telecomunicaciones (Ibarra, 2013).

Actualmente las empresas dedican una parte importante de su tiempo y de sus recursos

económicos y humanos a la obtención, procesamiento, aplicación y proyección de

información. Por esta razón, juega un papel decisivo en las organizaciones y se convierten

en un elemento importante para que se puedan alcanzar los objetivos del negocio. La

información debe ser clara, precisa y que se adapte a la formación y perfil de las personas

Page 30: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

13

a la que va dirigida, además se ser rápida y estar disponible en el momento que se la

necesite, y de una manera completa y armonizada con otras informaciones (Abreu, 2009).

Estas tecnologías agregan valor a las actividades operacionales y de gestión empresarial

en general y permite a las empresas obtener ventajas competitivas, permanecer en

el mercado y centrarse en su negocio. Las TIC’S constituyen un instrumento fundamental

para la organización interna de cualquier negocio, utilizarlas supone un importante ahorro

de tiempo y recursos, al simplificar y agilizar los procesos de gestión, toma de decisiones

y facilitar el contacto directo con la clientela, empresas proveedoras y de administración

pública (Savio, 2013).

La implementación de las TIC’S ofrecen mejor aprovechamiento del tiempo ya que la

automatización de tareas rutinarias mediante sistemas informáticos permite dedicar más

tiempo a tareas más productivas, mejor gestión del negocio mediante aplicaciones

informáticas y determinados dispositivos electrónicos se pueden controlar todas aquellas

variables y tareas que intervienen en el negocio y reducción de la carga administrativa

gracias a las herramientas informáticas las tareas administrativas se realizan de forma

intuitiva y automatizada (Savio, 2013).

2.3 Gestión de la Información La gestión de información es el aprovechamiento de los datos, la información y el

conocimiento disponibles en las organizaciones para apoyar los procesos de negocios y

la toma de decisiones (Escuela Colombiana de Ingeniería, 2013). En la tabla 9, se

describen otras definiciones relacionadas con la Gestión de Información.

Tabla 9. Definiciones de Gestión de Información (Elaboración propia)

Definición Autor

La gestión de información es todo lo que tiene que ver con obtener la información correcta, en la forma adecuada, para la persona indicada, al costo correcto, en el momento oportuno, en el lugar indicado para tomar la acción precisa

(Woodman, 1985)

Es el proceso sistemático de buscar, organizar, filtrar y presentar la información con el objetivo de mejorar la comprensión de las personas en una específica área de interés.

(Davenport & Klahr, 1998)

Page 31: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

14

Es el proceso sistemático de detectar, seleccionar, organizar, filtrar, presentar y usar la información por parte de los participantes de la empresa, con el objeto de explotar cooperativamente el recurso de conocimiento basado en el capital intelectual propio de las organizaciones, orientados a potenciar las competencias organizacionales y la generación de valor.

(Harvard Business Review, 2003)

La gestión de la información es el proceso que se encarga de suministrar los recursos necesarios para la toma de decisiones, así como para mejorar los procesos, productos y servicios de la organización, y cobra especial importancia en las empresas con la aparición de la informática

(Palmero, 2005)

Proceso que incluye operaciones como extracción, manipulación, tratamiento, depuración, conservación, acceso y/o colaboración de la información adquirida por una organización a través de diferentes fuentes y que gestiona el acceso y los derechos de los usuarios sobre la misma.

(Curto, 2006)

La gestión de información es una disciplina cuyo objetivo es asegurar que la organización obtiene su mayor valor de los recursos de información disponibles y que estos se gestionan de una manera eficaz y eficiente

(Mireiapm, 2010)

La Gestión de la Información, según Ponjuán (2003), es el proceso mediante el cual se

obtienen, despliegan o utilizan recursos básicos (económicos, físicos, humanos o

materiales) para manejar información. Tiene como elemento básico la gestión del ciclo

de vida de este recurso y se desarrolla en cualquier organización. La Gestión de la

Información, debido al impetuoso desarrollo de las TIC’S, sucede cada vez más en

entornos virtuales, como portales y plataformas web, y hace uso de herramientas

informáticas cada vez más sofisticadas y, al mismo tiempo, más amigables y accesibles,

por lo que los propios usuarios se convierten a menudo en gestores de información

(García, 2010).

Las primeras posturas sobre las ciencias de información aparecen en la década de los

sesenta, pero sólo a partir de los años ochenta, puede hablarse del surgimiento de la

gestión de la información como disciplina práctica (García, 2010).

La gestión de información surge como un nuevo concepto dentro del campo de la

ciencia de la información, orientado al manejo de la inteligencia corporativa de una

Page 32: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

15

organización, que permite la estructuración interna a las empresas y les permite reaccionar

ante los cambios de su entorno apoyándose en el uso de los datos y de los recursos

de información disponibles (Rodríguez, 2002).

El objetivo central de la gestión de información en torno a cualquier problemática es

generar conocimiento profundo y sistemático tanto de la situación como de todas aquellas

acciones para contribuir a su solución, de tal manera que permitan generar los análisis

correspondientes para apoyar la toma de decisiones en cuanto a futuras acciones así como

apoyo a la generación o modificación de políticas. En este sentido, la información se

convierte en la memoria de la problemática (Presidencia de la república, 2010).

Los actores principales en la gestión de información son los miembros de las

organizaciones tanto proveedores como usuarios al mismo tiempo, esto debido a la

facilidad en el uso de herramientas para la captura, el procesamiento y análisis de

información (García, 2010).

Los procesos principales de la gestión de información son: la identificación de las

necesidades de información; la definición de la disponibilidad y accesos a las fuentes

informativas, su organización y almacenamiento; el análisis y monitoreo continuo a través

de diferentes modelos; el desarrollo de productos y servicios, su distribución y uso

compartido, base de la creación del conocimiento estructurado para la organización y, por

tanto, fundamento de la gestión del conocimiento (Moreira, Méndez y Rodríguez, 1999).

En la gestión de la información, como en todo proceso, es necesario realizar un estudio

previo de las necesidades de información, lo cual permitirá determinar con exactitud qué

información se necesita para apoyar las decisiones, lograr la estandarización de los

conceptos y el escalonamiento del ciclo de gestión de información, este último será la

herramienta para poder estructurar el éxito de la misma, un ciclo permite obtener

información sobre los resultados obtenidos, e introducir modificaciones a lo largo de su

aplicación(Presidencia de la república, 2010).

Page 33: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

16

La información y el conocimiento son parte de un mismo proceso complejo vinculado

por conceptos como aprendizaje, inteligencia y tecnologías. Los flujos de información y

la generación de nuevos conocimientos dependen de modelos de comportamientos

informacionales y cognitivos de las personas. Buscar, almacenar, procesar, analizar,

representar, compartir y distribuir información y conocimiento debe ser una labor

relacionada con la motivación y el estímulo de los usuarios y por ende, con la creación de

competencias y habilidades que se han de impulsar de manera sistemática (Presidencia

de la república, 2010).

En La figura 1, Se ilustran las diferentes fases del ciclo de la gestión de información, en

la cual se detallan las etapas de planificación de información, recolección de datos

(fuentes, métodos y pruebas), validación de datos, análisis de datos y reporte final de la

información.

Ilustración 1. Ciclo de Gestión de la Información (Dalkir, 2011).

Al organizar y coordinar las actividades de gestión de la información en su ciclo, es

preciso tomar en consideración las políticas y el horizonte del que hacer, por cuanto es

importante definir las fuentes, los métodos para la recopilación de datos, la

sistematización y uso de la herramienta tecnológica y ello surtir un proceso de aprobación.

Los datos que no se utilizan ni difunden no son útiles. La pertinencia, la actualidad y la

precisión son los tres principios que deben orientar la utilización y recopilación de la

información (Presidencia de la república, 2010).

Page 34: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

17

Este proceso se características por los siguientes atributos: La información se puede

almacenar y transferir, La información es de naturaleza intelectual e inmaterial, La

información caduca, La información puede ser compartida sin disminuir su utilidad para

ninguna de las personas que la utilizan, La información se enriquece con el intercambio

de ideas entre sus usuarios y La información no exige un uso excluyente

Es así, como la gestión de la información es el proceso que recolecta datos desde una

serie de fuentes definidas, y se encarga del correcto almacenamiento de los mismos

buscando la persistencia y la generación de conocimiento, la correcta implementación de

este proceso representa una ventaja competitiva para las empresas ya que de esta forma

se realiza una completa administración de la información la cual se convierte en clave de

desarrollo dentro del actual mercado en el cual la evolución tecnológica y las herramientas

generadas crean grandes volúmenes de información de diferente tipo diariamente.

2.3.1 Herramientas para la Gestión de la Información En la tabla 10, se describe una serie de herramientas tecnológicas que surgen a partir de

la evoluciones de las TIC’S y que permiten la adecuada gestión de la información

mejorándole a las personas y organizaciones el acceso a los datos.

Tabla 10. Herramientas de Gestión de la Información (Elaboración propia)

Herramienta Descripción Fuente

Experiencia Contextual y Social del

Usuario

Esta tendencia permitirá hacer acopio de información sobre los usuarios, su perfil y su entorno de forma tal que las interacciones sean más personalizadas y se aprovechen mejor las oportunidades de relacionamiento. Existen ya dispositivos que generan información sobre oportunidades de consumo para los usuarios, y sistemas que extraen información para proveer mejores servicios y soluciones a los consumidores.

(High, 2013)

Internet de las Cosas

Cada vez más, nos enteramos de dispositivos y aplicaciones en la red que permiten operar aparatos y sistemas, por ejemplo, artículos domésticos conectados en forma remota, generando así beneficios de diversa índole como seguridad, comodidad, ahorro, etc.

(High, 2013)

Page 35: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

18

Esta tendencia se va acelerar en la medida que se conecten más “cosas”

Tiendas de Apps y Mercados

Las tiendas de apps están evolucionando y con ello creando nuevos mercados. Se estima que para el 2015 tendremos setenta mil millones de apps que se van a bajar en estas tiendas. Las aplicaciones personales van a empezar a migrar hacia aplicaciones de negocios, todo esto sobre la nube, con lo cual los usuarios pagarán sólo lo que consumen

(High, 2013)

Analytics de Siguiente Generación

Los modelos analíticos van a cambiar la forma en que utilizamos la información. En la actualidad la información sólo describe lo que ya ocurrió, es decir, es histórica y por lo tanto reactiva. La evolución en los analytics genera una nueva inteligencia a partir de los datos de diferentes fuentes que nos permitirán anticipar los modelos de conducta a partir de distintos perfilamiento, mediante sistemas que “aprenden” y se ajustan por si mismos a partir de la nueva información y sucesos que se registran

(High, 2013)

Big Data

Las TIC es una industria que siempre crece incluso ante escenarios de secesión, ya que la población siempre aumenta, a la par de las necesidades de conectividad y acceso a aplicaciones de toda índole, tanto de orden personal como empresarial. Big Data tiene que ver con la gestión de enormes y crecientes volúmenes de información que ya no puede ser almacenada en un solo Warehouse de datos, sino en modelo distribuido de distintas unidades interconectadas en función de la naturaleza de la información

(High, 2013)

Computación en Memoria

La gran ventaja de la computación en memoria es lograr mayor rapidez, ya que reduce la latencia a mínimos y se pueden hacer procesos dentro de la misma memoria e incluso los procesadores serán más rápidos y eficientes en el consumo de energía

(High, 2013)

Ahorradores de Energía Extrema

El consumo de energía es una de las grandes prioridades en los Centros de Contacto, debido a los costos que genera. Los teléfonos celulares han generado la producción de procesadores de baja energía. De hecho, Gartner estima que cada vez habrá más de este tipo de procesadores. Con esta solución,

(High, 2013)

Page 36: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

19

los Centros de Datos serán mucho más eficientes, con servidores de mayor energía que tengan treinta o más procesadores)

Computación en la Nube

La gran tendencia es que las empresas migren hacia modelos en los que ya no sean dueñas de la infraestructura y servicios de TI, sino que las renten como servicio

(High, 2013)

2.4 Inteligencia de Negocios (BI) La Inteligencia de Negocios (en inglés BI, Business Intelligence) son las actividades que

realiza una empresa para hacer un uso eficiente de los datos recopilados, convertirlo en

información y obtener el conocimiento necesario para una correcta toma de decisiones

(Vanegas y Guerra, 2009). En la tabla 11, se describen otras definiciones relacionadas

con la Inteligencia de Negocios.

Tabla 11. Definiciones de Inteligencia de Negocios (Elaboración propia)

Definición Autor

Business Intelligence se refiere directamente a la práctica y al conjunto de herramientas que pueden ayudar a las empresas a adquirir un mejor entendimiento de ellas mismas. Esto gracias a la capacidad de explotar su información de una manera más sencilla y entender el porqué de nuestro desempeño o, mejor aún, plantear escenarios a futuro, lo cual nos ayudará a tomar mejores decisiones

(Flores, 2010)

Business Intelligence es un mercado que tiene como objetivo facilitar el acceso y análisis de la información corporativa y proporcionar las herramientas tecnológicas adecuadas para la toma de decisiones

(Urquizo, 2008)

La Inteligencia de Negocios es un concepto que hace referencia a las técnicas de análisis de datos destinados a encontrar información útil para la toma de decisiones, incluido el conjunto del software que aporta las interfaces y funciones necesaria que apoyan dicho proceso

(Ramírez, 2008)

Business Intelligence una arquitectura y colección de herramientas que buscan mejorar a las organizaciones, proporcionando vistas de aspectos de negocio a todos los empleados (estratégico, táctico, operacional) para que tomen mejores y más relevantes decisiones en menos tiempo y con la mayor información posible

(Torres, 2008)

Business Intelligence incluye las aplicaciones, infraestructura, herramientas y las mejores prácticas que permitan el acceso y el análisis de la información para mejorar y optimizar las decisiones y

(Gartner, 2013)

Page 37: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

20

El término Inteligencia de Negocio aparece a mediados de los años 90´s y ha tomado

relevancia en los últimos tiempos ya que permite a las empresas analizar una gran

cantidad de información de manera rápida y procesarla con reglas o criterios del negocio

en forma inteligente y que facilitan la toma de decisiones. Debido a la gran cantidad de

información que se genera hoy en día en las empresas la inteligencia de negocios integra

la información y puede ser cruzada entre procesos evitando análisis aislados o

incompletos (Gonzales, 2008).

De acuerdo con Parr (2000), la inteligencia de negocios se define como la habilidad

corporativa para tomar decisiones. Esto se logra mediante el uso de metodologías,

aplicaciones y tecnologías que permiten reunir, depurar, transformar datos, y aplicar en

ellos técnicas analíticas de extracción de conocimiento, Por su parte Ballrd (2006),

considera que la BI permite generar conocimiento sobre los problemas y oportunidades

del negocio para que pueden ser corregidos y aprovechados respectivamente.

En la actualidad, las organizaciones toman sus decisiones basándose cada vez más en

información y menos en el instinto de sus gerentes. La habilidad de una empresa para

rendimiento

BI proporciona una manera rápida y efectiva de recopilar, abstraer, presentar, formatear y distribuir la información de sus fuentes de datos corporativos, permitiendo a los profesionales de la empresa, tanto dentro como fuera de la organización, visualizar y analizar datos precisos sobre las actividades fundamentales del negocio y utilizarlos para mejorarla toma de decisiones y la planificación estratégica

(Rosado, 2010)

Es un conjunto de modelos matemáticos y metodologías de análisis que aprovechan los datos disponibles para generar información y conocimientos útiles para los complejos procesos de decisión

(Vercellis, 2009)

BI es un conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información no estructurada (interna y externa a la compañía) en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio

(Negash, 2004)

Business Intelligence se compone de todas las actividades relacionadas a la organización y entrega d información así como el análisis del negocio.

(Hackney, 2001)

Page 38: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

21

tomar buenas decisiones está directamente relacionada con su capacidad para transformar

ágilmente sus datos en información de calidad y ésta en conocimiento. Se hace necesario,

impulsar procesos que permitan aprovechar al máximo la información disponible,

buscando ofrecer mecanismos ágiles para la toma de decisiones con el fin de lograr un

mejor desempeño organizacional (Universidad Pontificia Bolivariana, 2012).

Algunas de las ventajas de BI son las siguientes: Permite disponer de una herramienta de

información sobre la gestión del negocio, facilita información que permita priorizar

actividades basadas en la necesidad de cumplimiento de objetivos de corto, mediano y

largo plazo, proporciona una única versión de la realidad del negocio y reduce la

incertidumbre y la subjetividad en el proceso de toma de decisiones.

En la figura 2, se ilustran las fases que componen la inteligencia de negocios, desde la

obtención de los datos, pasando por el proceso para convertirlos en información,

posteriormente en conocimiento y finalmente llegar a la toma de decisiones.

Ilustración 2. Fases de la Inteligencia de Negocios (Plugia, 2010)

El concepto de BI incluye una amplia categoría de metodologías, aplicaciones y

tecnologías que permiten concentrar, acceder, transformar y consultar datos,

transacciones e información no estructurada de la empresa (interna y externa) con el

objetivo de ayudar a tomar decisiones. Esto se puede lograr realizando la explotación

directa de la información (consulta) o llevando a cabo un análisis de la misma,

convirtiéndola en conocimiento (Barcelona Treball, 2012).

Page 39: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

22

Además, BI también puede intervenir en diferentes procesos de las empresas, facilitando

el correcto desarrollo de las tareas de los diferentes trabajadores, generando nuevas

actividades y nuevas habilidades, mejorando la comunicación entre diferentes

departamentos o incrementando la capacidad de reacción de la empresa (Barcelona

Treball, 2012).

La aparición e integración de los sistemas de BI tiene repercusiones directas en las

oportunidades de negocio y de empleo en el sector de las telecomunicaciones y TIC’S.

Pero también afecta transversalmente el resto de sectores, que son quienes adquieren estos

sistemas para mejorar la gestión de su negocio (Barcelona Treball, 2012).Sea una

organización pequeña, mediana o grande, siempre estará inundada de datos. Un sistema

de call center, inventarios, facturación, contabilidad, producción, legal, de cualquier

industria siempre será una buena fuente de información para entender el negocio (Cano,

2011).

Las estrategias de BI buscan proveer a la organización de un mecanismo de análisis que

le permita tomar mejores decisiones, una vez implementado un sistema basado en

inteligencia de negocios la empresa podrá contar con datos consolidados y un repositorio

único de donde extraer información consolidada lo cual generara beneficios como poder

de previsión, mejor visibilidad de hacia dónde debe ir al compañía y un mejor uso de los

recursos.

2.4.1 Aplicaciones de Business Intelligence

En la tabla 12, se describen algunos enfoques en los cuales se han empleado soluciones

de Business Intelligence.

Tabla 12. Aplicaciones Inteligencia de Negocios (Elaboración propia)

Sector Descripción Fuente

Salud

En el área de la salud, la ejecución de proyectos y el uso de herramientas de inteligencia de negocios proporciona a prestadores, administradores y pacientes múltiples beneficios como: Aumenta la seguridad del paciente al permitir una rápida

(Pomares, 2013).

Page 40: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

23

traducción de los descubrimientos científicos a la práctica clínica, Aumento en la rentabilidad de tratamientos gracias al análisis automatizado de evidencias que permite identificar los puntos críticos, Los profesionales de la salud pueden utilizar bases de datos externas (por ejemplo, los datos de investigaciones clínicas) para apoyar y orientar las decisiones internas, Aumenta la efectividad operativa y financiera al disponer de modelos predictivos y descriptivos que permitan analizar diferentes escenarios futuros y Aumentan los procesos colaborativos gracias a la disponibilidad de información para apoyar la toma de decisiones

Educativo

Business Intelligence (BI) ayuda a las instituciones educativas en el Control y reducción de gastos (seguimiento presupuestario, analítica), Mayor rentabilidad, Mayor competitividad y posicionamiento (gestión y retención del talento), Mejor gestión educativa (evaluaciones, seguimiento alumnos, profesores, calidad de la enseñanza, comparativas y benchmarking), Mayor capacidad de reacción ante cambios (escenarios de simulación para regulaciones, subvenciones, becas), Medición del impacto en el mercado (integración datos externos, seguimiento de campañas) y Mayor eficiencia (visión global, modelos causa-efecto, Balanced Scorecard).

(Edisa, 2009)

Inmobiliario

Una solución enfocada a la alta dirección, que permiten medir la estrategia mediante la consecución de objetivos, empleando indicadores y relaciones entre estos. Paralelamente, facilitan el seguimiento de acciones estratégicas y responsabilidades sobre el cumplimiento de objetivos empresariales y puesta en producción de acciones correctoras.

(López, 2013)

Asegurador

El éxito de las compañías aseguradoras depende en gran medida de la capacidad de predecir las reclamaciones o las posibles pérdidas en base a información basada en la experiencia. El Business Intelligence tiene un papel esencial para estas empresas, al ayudar a la mejora de la gestión de esa información, esencial para definir las políticas de precio o de cobertura de clientes y para ofrecer un

(García, 2010)

Page 41: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

24

mejor servicio adaptado a las necesidades de sus clientes.

Transporte

Business Intelligence en el sector de transporte y logística tiene aportes en el control y reducción de gastos (seguimiento presupuestario, contabilidad analítica), mayor rentabilidad, mayor competitividad y posicionamiento (oferta más atractiva, gestión y retención del talento), mejor gestión logística (stocks, productividad, integración vertical, rutas, comparativas), mayor capacidad de reacción ante cambios (escenarios de simulación para cambios en el entorno: precios, regulaciones, variación de demanda) y mayor eficiencia (visión global, modelos causa-efecto, Balanced Scorecard)

(Edisa, 2009)

Bancario

En un entorno en el que imperan condiciones económicas inciertas, cambios demográficos y una severa crisis de confianza en los mercados, el enfoque en el cliente y la gestión de riesgo son los principales factores que impulsan la rentabilidad y la participación del sector bancario. La necesidad de disponer de información para gestionar estas prioridades obliga a los bancos a integrar la información, así como implementar iniciativas de gestión y almacenamiento de datos. Ante este panorama, un proyecto de Business Intelligence (BI) puede ofrecer a los usuarios del sector bancario la visibilidad y capacidad analítica de forma rápida y rentable, lo cual facilitaría la toma de decisiones.

(Saldaña, 2011)

2.5 Big Data Big Data está asociado a conjuntos de datos que crecen rápidamente y que por su cantidad

se dificulta su almacenamiento, procesamiento, análisis y gestión (Mejía, 2013).En la

tabla 13, se describen otras definiciones relacionadas con Big Data.

Tabla 13. Definiciones de Big Data (Elaboración propia)

Definición Autor

Tendencia tecnológica que busca aprovechar y darle valor a la información

(Medina, 2013)

Page 42: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

25

Representa la necesidad de procesar rápidamente grandes cantidades de datos con una nueva hornada de soluciones tecnológicas que no son necesariamente la base de datos

(Lawson,2010)

Las tecnologías y prácticas emergentes que permiten recopilar, procesar, detectar y almacenar grandes volúmenes de datos estructurados y desestructurados de forma rápida y rentable

(Lawson, 2010)

Volumen masivo de datos, tanto estructurados como no-estructurados, los cuales son demasiado grandes y difíciles de procesar con las bases de datos y el software tradicionales

(ONU, 2012)

Big Data se refiere a la cantidad cada vez mayor de información que las organizaciones almacenan, procesan y el analizan, debido al creciente número de fuentes de información utilizadas.

(Tankard, 2012)

Término inglés que designa los conjuntos de datos de gran tamaño y generalmente desestructurados que resultan difíciles de manejar usando las aplicaciones de bases de datos convencionales

(Fidelity Worldwide Investment, 2013)

Término para una colección de conjuntos de datos tan grande y complejo que se hace difícil de procesar utilizando herramientas de gestión de base de datos a mano o datos tradicionales aplicaciones de procesamiento

(Innovation Edge, 2013)

Término que se emplea hoy en día para describir el conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran

(Innovation Edge, 2013)

El mundo ha evolucionado de una sociedad basada en las transacciones, a una basada en

las interacciones a medida que se interactúa más a través de correos electrónicos,

mensajes enviados desde dispositivos móviles (SMS), redes sociales y la Web. Esto ha

creado una explosión de datos en volumen y tipo que no se hubiera podido imaginar hace

algunos años (Posada, 2014).

Por lo mencionado anteriormente nacen tendencias de bases de datos como lo es Big Data,

esta se enfocan en el análisis de grandes cantidades de información para la predicción de

comportamientos. A partir de esta tendencia surge la analítica de datos, la cual se ha

Page 43: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

26

utilizado en el pasado tanto para descodificar los mensajes alemanes durante la Segunda

Guerra Mundial, para automatizar la defensa antiaérea apuntando contra aviones

enemigos, como para revolucionar el deporte profesional. La analítica predictiva ha

transformado y está cambiando cada día la vida moderna. El análisis de grandes

cantidades de datos ha revolucionado la investigación y el desarrollo, desde la estrategia

a seguir por empresas de cualquier tamaño o la forma en la que los consumidores toman

decisiones personales (Selta, 2013).

Las soluciones analíticas de Big Data están revolucionando la forma en que los

individuos, negocios, y gobiernos recolectan, almacenan y analizan los datos. Motivados

por la explosión en el volumen, variedad y velocidad de los datos disponibles, las

soluciones analíticas de Big Data están respondiendo a nuevas preguntas así como

ofreciendo respuestas más completas y precisas a preguntas que existían hace décadas.

En la tabla 14, se detallan las variables características de Big Data.

Tabla 14. Características de Big Data (Elaboración propia)

Característica Definición Autor

Volumen El volumen de los datos almacenados en los depósitos de las empresas ha pasado de ocupar megabytes y gigabytes a “petabytes”.

(Edge, 2013)

Variedad

La variedad de datos ha explotado, pasando de ser datos almacenados y estructurados, guardados en bancos de datos empresariales, a ser desestructurados, audio, video, XML, etc. Datos en streaming, cotizaciones bursátiles, medios sociales, máquina a máquina, datos de sensores… una creciente variedad de datos necesitan ser procesados y convertidos en información.

(Edge, 2013)

Velocidad La velocidad del movimiento, proceso y captura de datos dentro y fuera de la empresa ha aumentado significativamente.

(Edge, 2013)

Debido a las nuevas herramientas informáticas que en la actualidad se encuentran

posesionadas en el mercado, la información abunda y las empresas están buscando la

mejor forma de aprovecharla. Las empresas tienen acceso a más información que antes,

la cual proviene de muchas más fuentes y la obtienen casi al momento en que se genera.

Page 44: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

27

El concepto de Big Data a menudo se relaciona con las empresas que ya operan en el

mundo de la información, como Google, Facebook, y Amazon. Pero compañías en

múltiples industrias están colocando los datos en el corazón de sus operaciones. Están

recolectando grandes cantidades de información, a menudo combinando indicadores

tradicionales como las ventas, con comentarios de redes sociales e información de

ubicación que viene de los dispositivos móviles. (Aguilar, 2012)

Desde años atrás las empresas han utilizados la analítica de negocios para obtener

conocimiento. En la actualidad con la incursión de nuevas soluciones tecnológicas los

datos han aumentado exponencialmente y es por esto que el día de hoy el procesamiento

y análisis de información ha tomado mayor fuerza y se ha convertido casi en un proceso

obligatorio para las empresas. En la tabla 15, se describen hitos donde en el pasado se ha

utilizado la analítica de negocios y donde se prevé que se utilizara en el futuro.

Tabla 15. Hitos Analítica de Negocios (Elaboración propia)

Periodo de Tiempo Hito Autor

1930 - 1949

Se realizan trabajos para descodificar los mensajes alemanes en la segunda guerra mundial.

(Fico, 2013) Se automatiza la defensa antiaérea apuntando contra aviones enemigos.

Se realizan simulaciones por ordenador para predecir el comportamiento de una reacción nuclear en cadena.

1950 - 1969

Se genera el primer modelo de predicción meteorológica.

(Fico, 2013) La analítica resuelve el “problema del camino más corto” mejorando el transporte aéreo y la logística,

1970 - 1999

Se crea el modelo para predecir el precio óptimo de las acciones en el futuro.

(Edge, 2013) Se comercializa la primera herramienta para apoyar a las decisiones guiadas por modelo.

Lanzamiento de Amazon y eBay. Inicia personalización de la experiencia online.

Page 45: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

28

Se aplican algoritmos a las búsquedas web para maximizar la relevancia de los resultados.

2000 – Actualidad

Uso generalizado de la analítica. Recomendaciones de compra, gestión del tráfico, entre otros…

(Edge, 2013)

Proceso del lenguaje natural. Trabajo con datos no estructurados. Ejemplo mensajes de facebook, páginas web, PDFs e emails.

Llega de Big Data. Cada día se generan 2.5 trillones de bytes de datos.

Se hace viable la computación distribuida y el análisis de Big Data para la mayoría de las organizaciones.

Futuro

Intercambio de analítica en la nube. Aumento de la economía colaborativa.

(Edge, 2013) Las campañas de marketing desaparecen ya que la interacción con los consumidores es personal.

Sintetizando lo anterior, Big Data es la tendencia de base de datos que permite el

procesamiento de altos volúmenes de información obtenida de una serie de fuentes cuyos

datos no son estructurados, para las empresas esta tendencia de convierte en clave de su

propio desarrollo y vigencia en el mercado ya que ahora la tecnología se mueve por un

sinnúmero de aplicaciones que trabajan bajo imágenes, sonidos, videos y demás los cuales

están en aumento diariamente y las empresas deben poseer conocimientos y herramientas

parar soportar dichas aplicaciones y responder a las necesidades actuales de la sociedad.

En la tabla 16, se describen ejemplos reales de cómo diariamente se están generando

grandes cantidades de datos desde diferentes fuentes de información.

Tabla 16. Ejemplos de Aplicaciones de Big Data (Elaboración propia)

Ejemplo Autor

Los sistemas de RFID (Identificación por Radiofrecuencia) generan hasta 1.000 veces más datos que los sistemas convencionales de códigos de barras

(Edge, 2013)

Page 46: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

29

Facebook tiene más de 901 millones de usuarios activos generando datos de interacción social

(Edge, 2013)

Más de 5.000 millones de personas telefonean, mandan mensajes de texto, tuitean y navegan por internet con teléfonos móviles

(Edge, 2013)

Cada día se envían 340 millones de tuits. Son aproximadamente 4.000 por segundo

(Edge, 2013)

Al día se generan 2.5 trillones de bytes de datos. El 90% de los datos que hay hoy en día en el mundo se han creado tan solo en los últimos dos años

(Edge, 2013)

En el mundo se registran cada segundo 10.000 transacciones de pagos con tarjetas

(Edge, 2013)

2.5.1 Aplicaciones de Big Data

En la tabla 17, se describen enfoques en los cuales se han empleado Big Data.

Tabla 17. Aplicaciones de Big Data (Elaboración propia)

Sector Descripción Fuente

Salud

La tendencia a manipular ingentes cantidades de datos se debe a la necesidad en muchos casos de incluir los datos relacionados del análisis en un gran conjunto de datos relacionado, tal es el ejemplo de los análisis de negocio, los datos de enfermedades infecciosas, o la lucha contra el crimen organizado. En el campo de la Salud, cuando se habla de Big Data se habla principalmente del potencial de procesamiento de datos digitalizados en los servicios sanitarios, que en muchos casos lindan con el Business Intelligence en Salud

(Osorio, 2013)

Comercial

Sus ventajas para el negocio en áreas como la gestión de las relaciones con el cliente, el desarrollo de nuevos productos, la detección del fraude o la predicción del comportamiento de los consumidores permiten a las compañías obtener resultados financieros un 20% por encima de sus competidores, según estimaciones de Gartner

(Sánchez, 2013)

Financiero

Entre las aplicaciones prácticas que puede tener Big Data en el sector financiero estarían la mejora de las capacidades de venta cruzada de productos financieros o no financieros, a partir de patrones de compra o de interés mostrados en determinados productos disponibles online; el

(Martín, 2012)

Page 47: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

30

control de fraude, minimizando los riesgos de uso indebido de medios de pago cuando el titular se encuentra de viaje, por ejemplo; la mejora de los sistemas de “scoring” de crédito, incorporando elementos no tradicionales como las interacciones en redes sociales; y, por último, la fidelización y retención de clientes, ofreciéndoles promociones y ofertas comerciales adaptadas a sus necesidades y contexto.

Militar

De manera general, la aplicación de “Big Data” a defensa persigue capturar y utilizar grandes cantidades de datos para poder aunar sensores, percepción y decisión en sistemas autónomos.

(Ministerio de Defensa. 2012)

Industria Manufacturera

Las empresas manufactureras se esfuerzan por basar su producción en la demanda, para reaccionar más ágil y efectivamente a las cambiantes necesidades del mercado. Para lograrlo, requieren visibilidad y acceso a los datos provenientes tanto de la sección final del ciclo de la demanda como de la retroalimentación consignada por los clientes. Captura de enormes volúmenes de señales para la sección final del ciclo de la demanda (por ejemplo, los datos provenientes de los puntos de venta de las cadenas minoristas), así como de datos de investigaciones de mercado y encuestas sobre los sentimientos manifestados por los consumidores y Generación de valiosas percepciones en tiempo real, con el fin de ayudar a los encargados de las áreas de cadena de suministro, ventas y mercadeo a ser más reactivos y basar sus decisiones en las señales emitidas por las fuerzas de la demanda.

(Sala de Prensa Latinoamérica,

2013)

Informático

Big data se emplea en las consultas y resultados de los motores de búsqueda, los datos de las redes sociales (como los tuits), los datos meteorológicos, los datos astronómicos, la vigilancia militar, los datos económicos y bursátiles, los historiales médicos, los experimentos físicos (Gran Colisionador de Hadrones), los archivos fotográficos, la radio y la televisión, los vídeos (CCTV y YouTube) y los datos sobre transacciones

(Fidelity Worldwide Investment,

2013)

Otros Sectores

La capacidad de analizar eficazmente grandes cantidades de datos dio a la NASA ventaja durante la carrera espacial, sobre todo cuando construyó los cohetes Saturno V que llevaron al hombre a la luna. Durante la Guerra Fría, tanto EE.UU. como la Unión Soviética procesaban

(In Perspective, 2012)

Page 48: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

31

grandes cantidades de datos de vigilancia militar durante las operaciones de información y durante décadas, las previsiones meteorológicas diarias han corrido a cargo de enormes superordenadores. Y las casas de apuestas y los casinos han desarrollado y mejorado continuamente sus modelos estadísticos para ir un paso por delante de los apostadores, mientras que los equipos deportivos (en el beisbol, en el ciclismo y cada vez más en el fútbol) utilizan analistas y estadísticos con la esperanza de conseguir una ventaja competitiva.

2.5.2 Modelos de Negocio Big Data

En la figura 3, se ilustran los principales planteamientos de modelos de negocio

(Diferenciación basada en la información, Intercambio basada en la información y Redes

de distribución basadas en la información) que han surgido a partir de Big Data.

Ilustración 3. Modelo de Negocio Big Data (Harvard Business Review, 2012)

Diversos sectores están utilizando Big Data para transformar los modelos de negocio y

mejorar el rendimiento en muchas áreas.

En la tabla18, se especifican diferentes campos de trabajo en los cuales se han

implementados modelos de negocios basados en Big Data.

Page 49: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

32

Tabla 18. Modelos de Negocio Big Data (Elaboración propia)

Sector Áreas Fuente

Venta Minorista

Gestión de relaciones con el cliente

(Kearney, 2013)

Ubicación y distribución de tiendas

Detención y prevención de fraude

Optimizar la cadena de suministros

Precios dinámicos

Servicios Financieros

Trading algorítmico

(Kearney, 2013)

Análisis de riesgos

Detección de fraude

Análisis de carteras

Gobierno

Gobernanza del mercado

(Kearney, 2013)

Sistema de armas y contraterrorismo

Econometría

Informática aplicada a salud

Publicidad y Relaciones Publicas

Gestión de señales de demanda

(Kearney, 2013)

Publicidad personalizada

Análisis de sentimiento del mercado

Adquisición de clientes

Manufacturas

Investigación y productos

(Kearney, 2013)

Análisis de Ingeniería

Mantenimiento predictivo

Análisis de procesos y calidad

Optimización de la distribución

(Kearney, 2013) Medios y

Telecomunicaciones

Optimización de redes

Valoración de los clientes

Evitar pérdida de clientes

Prevención del fraude

Energía

Redes inteligentes

(Kearney, 2013)

Exploración

Modelos operacionales

Sensores de tendido eléctrico

Page 50: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

33

Salud y Ciencias de la Vida

Farmacogenòmica

(Kearney, 2013)

Bioinformática

Investigación farmacéutica

Investigación de resultados clínicos

2.5.3 Metodologías Big Data Debido a los beneficios que representa para las empresas el poder utilizar y procesar todos

los datos con los que cuentan sin importar el formato de su información, existen

metodologías para el desarrollo de proyectos basados en Big Data establecidas y/o

propuestas por varias empresas. En la tabla 19, se especifican metodologías de trabajo

Big Data.

Tabla 19. Metodologías Big Data (Elaboración propia)

Metodología Etapas Actividades Fuente

ICAV

Identificar

Identificar claramente las necesidades del negocio

(Big Data, 2013)

Identificar usuarios finales

Conocer las preguntas que requieren responder para tomar mejores decisiones empresariales

Consolidar

Ubicar donde están las fuentes de información requeridas para responder las preguntas del negocio

Identificar que fuentes de información no estructuradas se requieren para hacer más rico el análisis

Consolidar información e repositorio común donde se acumulen las agregaciones y transformaciones necesarias para poder responder de la mejor manera las respuestas del negocio

Analizar Realizar el análisis de grandes volúmenes de información utilizando técnicas avanzadas de análisis predictivo y minería de datos

Visualizar

Diseminar esa información a los usuarios responsables para que puedan visualizar la información para la toma de decisiones empresariales

Definir la arquitectura del negocio)

Page 51: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

34

Big Data Consulting

Methodology

Análisis de Negocio

Analizar los procesos del negocio

(Big Data, 2012)

Identificar clave de Big Data

Análisis de Datos

Definir la arquitectura de datos

Analizar el flujo de datos y el procesamiento

Definir la arquitectura técnica

Análisis Gap

Investigar las mejores prácticas para el tratamiento de grandes volúmenes de datos

Analizar brecha entre las mejores prácticas y la arquitectura de los datos heredados

Arquitectura de Datos

Definir arquitectura de datos

Definir arquitectura técnica para soportar la arquitectura de datos

Análisis del impacto

comercial

Definir las funciones de negocio afectadas por Big Data

Estimar el ROI (retorno de la inversión)

CBIG Framework

Estrategia

Identificar oportunidades

(CBIG, 2009)

Construir el caso de negocio

Determinar la gobernabilidad y la propiedad

Determinar solución de arquitectura

Hoja de ruta de Big Data

Arquitectura

Arquitectura • Datos • Procesos • Análisis • Visualización • Infraestructura y herramientas

Hoja de ruta de integración

Integración

Arquitectura

Infraestructura

Canales y Datos

Integración cloud

Mejores prácticas y metodologías

Realización

Mayor visibilidad

Previsibilidad

Visión estratégica

Page 52: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

35

Crear valor

Metodología Compañía

Business Rio

Comprender la necesidad y panorama

actual

Priorización de las futuras capacidades de la arquitectura

(Business Rio)

Evaluar la disposición de datos

Desarrollar un proyecto

original de datos

Definir cuellos de botella

Identificar escenario

Identificar soluciones de alto nivel

Analizar riesgos y desafíos

Identificar arquitectura de

datos

Resaltar las capacidades arquitectónicas

Identificar las dependencias de tecnología, sistemas afectados

Perfeccionar los esquemas de almacenamiento de datos y los requisitos de mejora del inventario

Construir un plan del

proyecto de datos

Plan de lanzamiento basado en dependencias, prioridades y complejidades

Implementar solución de Big Data

Entregar fase de liberación

Evaluar los indicadores de desempeño

Medidas de control de procesos documentales

Las diferentes fases de la metodologia ICAV para la implementacion de proyectos de Big

Data se enfocan en lograr el exitoso termino de dichos proyectos, desde la identiificacion

de la necesidad hasta la visualizacion de resultados, pasando por un proceso de analsiis e

interpretacion de informacion.

En la figura 4, se ilustran las diferentes etapas empeladas dentro de la metodología ICAV.

Page 53: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

36

Ilustración 4. Pasos Metodología ICAV (Big Data, 2013)

Big Data Consulting Methodology plantea una serie de etapas que abarcan todo el proceso

de creación de soluciones enfocándose en el análisis de diferentes áreas del negocio. En

la figura 5, se ilustran las diferentes etapas empeladas por Big Data Consulting

Methodology.

Ilustración 5. Big Data Consulting Methodology (Big Data Consulting, 2012)

CBIG Framework plantea una metodología diseñada para ayudar a las organizaciones que

desean aprovechar el poder de los grandes datos. En la figura 6, se ilustran las diferentes

etapas establecidas dentro de CBIG Framework para las soluciones de Big Data.

Page 54: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

37

Ilustración 6. CBIG Framework (Big Data Consulting, 2012)

La metodología de trabajo planteada por la compañía Business Rio se enfoca en integrar

grandes volúmenes de datos en la hoja de ruta general de TI dentro de la empresa. En la

figura 7, se ilustran las diferentes etapas establecidas dentro de la Metodología de la

Compañía Business Rio.

Ilustración 7. Metodología de la Compañía Business Rio ((Business Rio))

2.5.4 Técnicas para el Análisis de Información Big Data Hay muchas técnicas que se basan en disciplinas como la estadística y la informática que

Page 55: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

38

se pueden utilizar para analizar conjuntos de datos. A continuación se listan técnicas

aplicables en una amplia gama de industrias para el manejo de grandes volúmenes de

información (Ibermatica, 2011). En la tabla 20, se especifican las técnicas para el análisis

de información Big Data.

Tabla 20. Técnicas para el Análisis de Información Big Data (Elaboración propia)

Técnica Descripción Fuente

A / B Testing

Técnica en la que se compara un grupo de control con una variedad de grupos de prueba para determinar qué cambios mejoran una variable objetivo determinado. Esta técnica también se conoce como splittesting o buckettesting. Un ejemplo de aplicación es determinar qué textos, presentaciones, imágenes, colores mejorará los ratios convirtiendo una Web en un sitio de comercio electrónico. Big data permite a un gran número de pruebas para ser ejecutado y analizado, lo que garantiza que los grupos son de tamaño suficiente para detectar estadísticamente significativas diferencias entre el control y los grupos de tratamiento.

(Ibermatica, 2011)

Reglas de Asociación

Conjunto de técnicas para descubrir relaciones interesantes, es decir, “reglas de asociación,” entre las variables en las grandes bases de datos. Estas técnicas consisten en una serie de algoritmos para generar y poner a prueba las reglas posibles. Una de las aplicaciones es el análisis de la compra, en la que un vendedor puede determinar qué productos se compran conjuntamente con frecuencia y usar esta información para la comercialización (un ejemplo que se cita es el descubrimiento de que muchos compradores de supermercados que compran pañales también tienden a comprar cerveza).

(Ibermatica, 2011)

Clasificación

Un conjunto de técnicas para identificar las categorías a las que nuevos data points pertenecen, sobre la base de un entrenamiento conjunto que contiene los data points que ya han sido clasificadas. Una aplicación es la predicción de segmentos específicos de comportamiento de los clientes (por ejemplo, las decisiones de compra, tasa de rotación, tasa de consumo), donde hay una hipótesis clara o un resultado objetivo.

(Ibermatica, 2011)

Análisis de Cluster

Método estadístico para clasificar los objetos que se divide un grupo diverso en pequeños grupos de objetos similares, cuyas características de similitud no se conocen de antemano. Un ejemplo de análisis de cluster es la segmentación de los

(Ibermatica, 2011)

Page 56: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

39

Técnica Descripción Fuente

consumidores en grupos de auto-similares para la comercialización directa. Este es un tipo de aprendizaje no supervisado, porque los datos de entrenamiento no se utilizan.

Fusión de Datos e Integración de Datos

Conjunto de técnicas para integrar y analizar datos de múltiples fuentes con el fin de desarrollar ideas en formas que sean más eficientes y potencialmente más precisas que si se han desarrollado mediante el análisis de una sola fuente de datos. Los datos de los medios de comunicación social, analizados por el procesamiento del lenguaje natural, se pueden combinar con datos en tiempo real las ventas, con el fin de determinar el efecto que una campaña de marketing está teniendo sobre la confianza del cliente y el comportamiento de compra.

(Ibermatica, 2011)

Minería de Datos

Un conjunto de técnicas para extraer patrones a partir de grandes conjuntos de datos mediante la combinación de los métodos de estadística y de aprendizaje de máquina con la gestión de bases de datos. Estas técnicas incluyen el aprendizaje de reglas de asociación, análisis de cluster, la clasificación y regresión. Las aplicaciones incluyen la minería de datos del cliente para determinar los segmentos más propensos a responder a una oferta, la minería de datos de recursos humanos para identificar las características de la mayoría de los empleados con éxito, o el análisis de cesta de la compra para modelar el comportamiento de compra de los clientes.

(Ibermatica, 2011)

Conjunto de Aprendizaje

El uso de varios modelos de predicción (cada uno desarrollado con estadísticas y / o aprendizaje de máquina) para obtener un mejor rendimiento de predicción. Este es un tipo de aprendizaje supervisado.

(Ibermatica, 2011)

Modelos de Predicción

Conjunto de técnicas en el que se crea un modelo matemático para predecir mejor las probabilidades de un resultado. La regresión es un ejemplo de las técnicas de modelado predictivo.

(Ibermatica, 2011)

Algoritmos Genéticos

Una técnica utilizada para la optimización que se inspira en el proceso de evolución natural o “supervivencia del más apto”. En esta técnica, las posibles soluciones se codifican como “cromosomas” que se pueden combinar y mutar. Estos cromosomas individuales se seleccionan para la supervivencia en un modelo “medio ambiente” que determina la idoneidad o el rendimiento de cada individuo de la población. A menudo descrito como una especie de “algoritmo

(Ibermatica, 2011)

Page 57: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

40

Técnica Descripción Fuente

evolutivo”, estos algoritmos son muy adecuados para la solución de problemas no lineales. Ejemplos de aplicaciones incluyen mejorar la planificación de tareas en la fabricación y optimizar el rendimiento de una cartera de inversiones.

Procesamiento del Lenguaje Natural

(NLP)

Conjunto de técnicas de una subespecialidad de la informática (dentro de un campo históricamente llamada “inteligencia artificial”) y de la lingüística que utiliza algoritmos computacionales para analizar el lenguaje humano (natural). Muchas de las técnicas de PNL son los tipos de aprendizaje automático. Una de las aplicaciones de la PNL se utiliza el análisis de los sentimientos de los medios de comunicación social para determinar cómo los clientes potenciales están reaccionando a una campaña de marca.

(Ibermatica, 2011)

Redes Neuronales

Modelos computacionales, inspirados en la estructura y el funcionamiento de redes neuronales biológicas (es decir, las células y conexiones en el cerebro), para encontrar patrones en los datos. Las redes neuronales son muy adecuadas para la búsqueda de patrones no lineales. Pueden ser utilizados para el reconocimiento de patrones y su optimización.

(Ibermatica, 2011)

Análisis de Redes

Conjunto de técnicas utilizadas para caracterizar las relaciones entre los nodos discretos en un gráfico o una red. En el análisis de redes sociales, las conexiones entre los individuos en una comunidad u organización se analizan, por ejemplo, cómo viaja la información, o quién tiene más influencia sobre quién. Ejemplos de aplicaciones incluyen la identificación de líderes de opinión para orientar a la comercialización, y la identificación de cuellos de botella en los flujos de información de la empresa.

(Ibermatica, 2011)

Optimización

Técnicas numéricas utilizadas para rediseñar los sistemas y procesos complejos que mejoran su rendimiento de acuerdo a una o más medidas objetivas (por ejemplo, el costo, la velocidad o fiabilidad). Ejemplos de aplicaciones incluyen la mejora de los procesos operativos, como la programación, el enrutamiento y distribución en planta, y la toma de decisiones estratégicas, como la estrategia de la gama de productos, análisis de inversión vinculados, y de I + D estrategia de cartera. Los algoritmos genéticos son un ejemplo de optimización.

(Ibermatica, 2011)

Reconocimiento de Patrones

Conjunto de técnicas de aprendizaje automático para asignar algún tipo de valor de la producción

(Ibermatica, 2011)

Page 58: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

41

Técnica Descripción Fuente

(o etiqueta) a un valor de entrada dado (o instancia) de acuerdo a un algoritmo específico. Las técnicas de clasificación son un ejemplo.

Regresión

Conjunto de técnicas estadísticas para determinar cómo el valor de la variable dependiente cuando una o más variables independientes se han modificado. A menudo se utiliza para el pronóstico o la predicción. Ejemplos de aplicaciones incluyen el volumen de ventas de predicción basado en el mercado y otras variables económicas o la determinación de los parámetros de fabricación.

(Ibermatica, 2011)

Análisis del Sentimiento

Aplicación de procesamiento de lenguaje natural y otras técnicas analíticas para identificar y extraer la información subjetiva de material de origen del texto. Los aspectos clave de estos análisis incluyen la identificación de la función, aspecto o producto sobre el cual se expresa un sentimiento, y determinar el tipo, la “polaridad” (es decir, positivo, negativo o neutro) y el grado y la fuerza del sentimiento. Ejemplos de aplicaciones incluyen las empresas que solicitan el análisis de los sentimientos de los medios de comunicación social (por ejemplo, blogs, micro blogs y redes sociales) para determinar cómo los diferentes segmentos de clientes y partes interesadas están reaccionando a sus productos y acciones.

(Ibermatica, 2011)

Análisis Espacial

Conjunto de técnicas, algunas aplicadas a la estadística, que analizan las propiedades topológicas, geométricas, o geográficos codificados en un conjunto de datos. A menudo, los datos para el análisis espacial provienen de los sistemas de información geográfica (GIS) en que la captura de datos incluye información sobre la ubicación, por ejemplo, direcciones o latitud / longitud. Ejemplos de aplicaciones incluyen la incorporación de los datos espaciales en regresiones espaciales (por ejemplo, cómo es la disposición del consumidor a comprar un producto relacionada con la ubicación).

(Ibermatica, 2011)

Visualización

Técnicas utilizadas para la creación de imágenes, diagramas o animaciones para comunicarse, entender y mejorar los resultados de los análisis de grandes volúmenes de datos.

(Ibermatica, 2011)

Estadísticas

Ciencia de la recopilación, organización e interpretación de datos, incluyendo el diseño de encuestas y experimentos. Las técnicas estadísticas se utilizan a menudo para hacer juicios sobre que las relaciones entre variables podrían haber ocurrido por casualidad (la “hipótesis nula”),

(Ibermatica, 2011)

Page 59: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

42

Técnica Descripción Fuente

y que las relaciones entre las variables de resultado probable de algún tipo de relación causal subyacente (es decir, que son “estadísticamente significativos”). Las técnicas estadísticas se utilizan también para reducir la probabilidad de errores de tipo I (“falsos positivos”) y errores de tipo II (“falsos negativos”). Un ejemplo de una aplicación es las pruebas A / B para determinar qué tipo de material de marketing que la mayoría de aumentar los ingresos.

Aprendizaje Supervisado

Conjunto de técnicas de aprendizaje automático que infieren una función o relación de un conjunto de datos de entrenamiento. Los ejemplos incluyen la clasificación y el vector de apoyo machines.

(Ibermatica, 2011)

Simulación

Modelar el comportamiento de sistemas complejos, a menudo utilizado para el pronóstico, la predicción y planificación de escenarios. Simulaciones de Monte Carlo, por ejemplo, son una clase de algoritmos que se basan en un muestreo repetido al azar, es decir, miles de simulaciones, cada una basada en supuestos diferentes. El resultado es un histograma que proporciona una distribución de probabilidad de los resultados. Una aplicación es la evaluación de la probabilidad de alcanzar las metas financieras dadas las incertidumbres sobre el éxito de varias iniciativas.

(Ibermatica, 2011)

Análisis de Series

Conjunto de técnicas estadísticas y de procesamiento de señales para el análisis de secuencias de puntos de datos, que representan los valores en tiempos sucesivos, para extraer las características significativas de los datos. Ejemplos de análisis de series de tiempo incluye el valor por hora de un índice bursátil o el número de pacientes diagnosticados con una enfermedad determinada todos los días. Predicción de series es el uso de un modelo para predecir los valores futuros de una serie sobre la base de los valores anteriores o de otra índole. Algunas de estas técnicas, por ejemplo, el modelado estructural, estudio de la tendencia de una serie durante un tiempo, y los componentes residuales, que pueden ser útiles para la identificación de patrones cíclicos en los datos. Ejemplos de aplicaciones incluyen previsiones cifras de ventas, o la predicción del número de personas que serán diagnosticadas con una enfermedad infecciosa

(Ibermatica, 2011)

Aprendizaje no Supervisado

Conjunto de técnicas de aprendizaje automático que se encuentra escondida en la estructura de

(Ibermatica, 2011)

Page 60: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

43

Técnica Descripción Fuente

datos sin etiquetar. El análisis de conglomerados es un ejemplo de aprendizaje no supervisado.

2.6 Seguridad de Información Big Data El auge de las redes sociales y otros servicios online, han convertido a Internet en una

gigantesca plataforma para la recolección de información, puesto que los usuarios van

registrando lo que les gusta y lo que no. Cada vez que una persona publica un comentario

en twitter o realiza una compra, se está generando informacion. Esta explosión de datos

es de tal envergadura que se necesitannuevas palabras para describirla, los gigabytes ya

no son suficientes, el volumen de los datos actualmente más grande y se mide en

petabytes, exabytes, zettabytes y yottabytes (Rodriguez, 2009).

En este contexto, las empresas necesitan especialmente dominar Big Data, aprovechar su

valor y al mismo tiempo hacer frente a los desafíos de seguridad que puedan plantearse.En

un proceso Big Data siempre es necesario destilar la información de valor a partir de los

datos en bruto que se reciben de la red. Es sobre la información procesada sobre la que se

debe aplicar especial atención desde el punto de vista de la seguridad (Rodriguez, 2009).

El primer desafío en el ámbito de la seguridad al que se enfrenta cualquier organización

que emprenda proyectos de Big Data es asegurar que sólo las personas adecuadas acceden

a determinadas categorías de información. Dentro de las empresas esto significa

establecer unos protocolos de acceso específicos para usuarios de negocio, otros para los

usuarios del área IT y separar claramente las tareas entre los usuarios de negocio y los

usuarios de tecnologia (Rodriguez, 2009).

Page 61: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

44

Otro aspecto a tener en cuenta es qué tipo de medidas se van a establecer, mediante la

puesta en funcionamiento de herramientas de seguridad avanzada para evitar las fugas de

información. No hay que olvidar que los proyectos Big Data, que recopilan tanto

información estructurada como información no estructurada, son susceptibles de

acumular una gran cantidad de información de carácter sensible ya que en su mayoria los

datos provienen de redes sociales. Aunque dicha información haya sido cedida

voluntariamente por los usuarios, es imprescindible contar con mecanismos que aseguren

su confidencialidad e integridad, mediante sistemas de control de acceso y cifrado

(Rodriguez, 2009).

Por último, una adecuada política de seguridad en proyectos Big Data debe asegurar la

disponibilidad de la información y establecer unos niveles de protección proporcionados

a los riesgos y consecuencias de una posible pérdida. Así, la información más valiosa o

sensible debe estar protegida con mayores niveles de disponibilidad (Rodriguez, 2009).

Según Rodriguez, para garantizar la seguridad en una solución que se base en el

almacenamiento, procesamiento y análisis de información tipo Big Data, se deben

implementar las siguientes recomendaciones para afrontaren los proyectos de este tipo.

• Asegurar la computación en marcos de programación distribuidos.

• Implantar las mejores prácticas de seguridad en almacenamiento de datos no

relacionales.

• Asegurar el almacenamiento de datos y transacciones.

• Validación en el punto final (End-pointvalidation).

Page 62: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

45

• Seguridad en tiempo real y compliance en la monitorización.

• Data mining y analítica escalable y con capacidad de preservar la privacidad de

los datos.

• Control de acceso y seguridad de la comunicación con sistemas encriptados.

• Control de acceso granular.

• Auditorías granulares.

• Gestión de la procedencia de los datos, en particular en los casos en los que es

importante registrar el historial digital de los mismos.

Un factor clave de las soluciones de analítica de negocios es garantizar las disponibilidad,

accesibilidad y protección de la información, ya que esta se convierte en la base para la

toma de decisiones a partir de su procesamiento y análisis, es aquí donde se encuentra el

conocimiento de las compañías y por esto se requiere de procesos bien definidos que

garanticen su seguridad.

2.7 Big Data Enfocada a la Inteligencia de Negocios Big Data está llevando sus capacidades hacia las manos de los directivos de nivel de línea,

que luego pueden utilizar datos no transaccionales para tomar decisiones empresariales

estratégicas a largo plazo, Big Data hará que la Inteligencia de Negocios sea más valiosa

y útil para el negocio (Ediciones Especiales Online, 2013).

Es importante analizar los procesos de toma de decisiones a partir del complemento que

puede representar Big Data ya que el exceso de información que se genera día a día,

ocasiona que las empresas comiencen a perder visibilidad sobre lo que ocurre en la

operación, y en ocasiones que la trazabilidad de la información se vuelve muy

complicada. A esto se suma que el tipo de contenido que se genera ya tiene varias formas

Page 63: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

46

de presentarse, bien puede ser en texto, audio, imagen, video o una combinación de ellos

(Cervantes, 2014).

Combinando bases de datos relacionadas y no relacionadas, se pueden pronosticar

conductas y detectar patrones de comportamiento, como la influencia del clima, el

impacto de los materiales o colores usados en un producto y hasta predecir la demanda

para hacer presupuestos que determinarán el inventario y las negociaciones con

proveedores (Empresas Inteligentes, 2014).

A este fenómeno se le conoce como Big Data, y para el procesamiento de tanta

información existen procesos que se encargan de filtrar y tener como salida datos

relevantes y concisos según lo que se requiera. Business Intelligence (Inteligencia de

Negocios) se apoya de estas herramientas para obtener información importante para la

toma de decisiones en las organizaciones. La convergencia de las tecnologías de este tipo,

dan como resultado un alto valor a las empresas y organizaciones, al reducir los tiempos

en los que se realiza la toma de decisiones (Empresas Inteligentes, 2014).

Combinar Inteligencia de Negocios y Big Data permite un análisis potente de una gran

cantidad de datos que brinda una ventaja competitiva clave: la de transformar cualquier

tipo de datos (volumen, forma, ubicación) en informaciones de alto valor agregado para

cada sector de la empresa. Sin embargo, hay que saber explotar esta materia prima para

que se transforme en el mayor capital de una organización: el conocimiento pertinente

del negocio.

La alianza Inteligencia de Negocios y Big Data permite entre otras cosas, medir el sentir

de los consumidores, optimizar las cadenas de suministro y detectar el fraude (Sánchez,

2013). Es así como el proceso de toma de decisiones a partir de la información obtenida,

procesada y analizada a partir de la unión de estas tendencias de base de datos se puede

optimizar ya que es posible incluir mayores cantidades de datos desde diferentes fuentes

de información.

Page 64: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

47

CAPITULO3. DIAGNOSTICO DEL ESTADO ACTUAL DE LA UNIDAD DE

ANÁLISIS EN EL CONTEXTO DE LA GESTION DE GRANDES VOLUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION DE ANALITICA DE

NEGOCIOS

De acuerdo a la metodología planteada en el numeral 1.5, a continuación se desarrolla la

segunda etapa planteada en el presente proyecto de investigación “diagnóstico del estado

actual de la unidad de análisis”, en la cual se analiza la situación en la cual se encuentra

MVM Ingeniería de Software S.A.S en el contexto de la gestión de grandes volúmenes

de información para la implementación de soluciones de analítica de negocios, con el fin

de identificar posibles falencias y/o dificultades a partir del marco conceptual elaborado

en el en el capítulo 2.

3.1 Instrumento de recolección de la información Para determinar el estado actual de la gestión de grandes volúmenes de información en el

contexto de las soluciones de analítica de negocios que desarrolla MVM Ingeniería de

Software S.A.S, se utilizó como instrumento de recolección de la información la encuesta;

Este instrumento es de gran importancia ya que permite conocer la opinión en relación

con los objetivos de la investigación de un grupo de personas seleccionadas y de acuerdo

con Trespalacios, Vázquez y Bello (2005), es utilizada en investigaciones de tipo

descriptiva, desde la cual se precisan identificar las preguntas a realizar, las personas

seleccionadas en una muestra representativa de la población, especificar las respuestas y

determinar el método empleado para recoger la información que se vaya obteniendo.

Dentro de la investigación se empleó la encuesta ya que por medio de esta técnica se logró

conocer de forma precisa la opinión de los expertos en gestión de información dentro de

la unidad de análisis, además de poder generar un estudio con cifras exactas para un

análisis preciso del estado actual de MVM Ingeniería de Software S.A.S en el contexto

de las soluciones de analítica de negocios. En la tabla 21, se detalla la ficha técnica de la

encuesta.

Page 65: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

48

Tabla 21. Ficha Técnica Encuesta (Elaboración propia)

Ficha Técnica

Para acompañar cualquier publicación de los resultados, la siguiente ficha técnica debe ser incluida en su totalidad

Persona quien Realizo la Encuesta: Isabel Cristina Gómez Díaz Esneyder Ardila Cañas

Persona Encomendado y Financió: Isabel Cristina Gómez Díaz Esneyder Ardila Cañas

Grupo Objetivo: Colaboradores de MVM Ingeniería de Software S.A.S expertos en la gestión de información e inteligencia de negocios

Tamaño de la Muestra: 7 encuestas reales, 7 encuestas ponderadas.

Técnica de Recolección de Datos: Diligenciamiento de formulario desarrollado y publicado en Google drive

Tipo de la Muestra: La muestra es dirigida, los encuestados seleccionados son empleados de MVM Ingeniería de Software S.A.S

Preguntas que se Formularon: Ver Anexo A

Tema o Temas a los que se Refiere: Gestión de grandes volúmenes de información en el contexto de las soluciones de analítica de negocios

Fecha de Realización: Del 19 al 23 de Abril de 2014 Área / Cubrimiento: MVM Ingeniería de Software S.A.S Margen de Error Observado: 5.0% con 95% de confianza

En el anexos A, se ilustra la encuesta realizada a siete profesionales expertos de MVM

Ingeniería de Software S.A.S., en el contexto de gestión de información e inteligencia de

negocios, la encuesta tuvo como propósito realizar una investigación de tipo cualitativa,

donde se emplea el método de estudio de caso con el fin de plantear Estrategias para la

Gestión de Grandes Volúmenes de Datos por Medio de Big Data en el Contexto de la

Analítica de Negocios, el objetivo de este instrumento de recolección de información fue

conocer la opinión de expertos de MVM Ingeniería de Software S.A.S en el contexto de

la gestión de gestión de la información y analítica de negocios, con el fin de recibir sus

contribuciones en relación a la gestión de grandes volúmenes de información estructurada

y desestructurada para la implementación de soluciones y/o proyectos de Big Data. Esta

encuesta fue creada a través de la herramienta Google Docs. En el numeral 3.2, se

presenta el análisis de los resultados producto de la encuesta realizada.

3.2 Resultados de la encuesta A continuación se detalla el resultado obtenido por cada una de las preguntas generadas

en el instrumento de recolección de información (encuesta).

Page 66: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

49

Figura 1. Resultado pregunta 1 de la encuesta (Google drive)

Figura 2. Resultado pregunta 2 de la encuesta (Google drive)

Figura 3. Resultado pregunta 3 de la encuesta (Google drive)

Figura 4. Resultado pregunta 4 de la encuesta (Google drive)

Page 67: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

50

Figura 5. Resultado pregunta 5 de la encuesta (Google drive)

Figura 6. Resultado pregunta 6 de la encuesta (Google drive)

Figura 7. Resultado pregunta 7 de la encuesta (Google drive)

Figura 8. Resultado pregunta 8 de la encuesta (Google drive)

Page 68: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

51

Figura9. Resultado pregunta9 de la encuesta (Google drive)

Figura10. Resultado pregunta10 de la encuesta (Google drive)

Figura 11. Resultado pregunta11 de la encuesta (Google drive)

Figura 12. Resultado pregunta 12 de la encuesta (Google drive)

Page 69: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

52

Figura 13. Resultado pregunta 13 de la encuesta (Google drive)

Figura 14. Resultado pregunta 14 de la encuesta (Google drive)

Figura 15. Resultado pregunta 15 de la encuesta (Google drive)

Figura 16. Resultado pregunta 16 de la encuesta (Google drive)

Page 70: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

53

Figura 17. Resultado pregunta 17 de la encuesta (Google drive)

Figura18. Resultado pregunta 18 de la encuesta (Google drive)

Figura 19. Resultado pregunta 19 de la encuesta (Google drive)

Figura20. Resultado pregunta20 de la encuesta (Google drive)

Page 71: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

54

Figura 21. Resultado pregunta 21 de la encuesta (Google drive)

Figura 22. Resultado pregunta 22 de la encuesta (Google drive)

Figura 23. Resultado pregunta 23 de la encuesta (Google drive)

3.3 Análisis de resultados En la tabla 22, se describen los resultados porcentuales de cada una de las preguntas realizadas en la encuesta con sus respectivos análisis. Los cuales se ubican en las siguientes etapas planteadas a través de la metodología ICAV la cual se enfocan en el ciclo de vida de la gestión de la información en el contexto de la gestión de grandes volúmenes de información no estructurada, las etapas son: Identificar (planeación y análisis), consolidar (obtención, transformación, seguridad y almacenamiento de datos), analizar (procesamiento y análisis de datos) y visualizar (visualización de información).

Page 72: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

56

Tabla 22. Análisis de los resultados (Elaboración propia)

Identificar (planeación y análisis) Interpretación De acuerdo a la opinión de los expertos encuestados, consideran con un 29% que el principal beneficio de las soluciones que actualmente desarrolla MVM Ingeniería de Software S.A.S en el contexto de la analítica de negocios, al ofrecer la implementación, procesamiento, análisis y manejo de grandes volúmenes de datos , tiene que ver con el conocimiento de las necesidades y preferencias de los clientes, lo cual facilitara tomar decisiones más acertadas en cuanto a la orientación de productos y/o servicios para satisfacer necesidades de los clientes de forma específica. El segundo beneficio con un 23%, tiene que ver con el Análisis de mayores volúmenes de información permitiendo tener en cuenta diversas fuentes de datos, lo cual facilitara tomar decisiones más acertadas referentes al negocio en general.

A partir del resultado obtenido en las preguntas relacionadas con la etapa planeación y análisis, y según los datos de las figuras 4, 11, 15, 16, 18, 19 y 23 del punto 3.2, se identifica que en MVM Ingeniería de Software S.A.S se reconoce la importancia y los beneficios que ofrece el manejo de grandes volúmenes de información para las aplicaciones de analítica de negocios que actualmente se desarrollan, ya que de esta forma se pueden conocer tendencias y necesidades de los usuarios para una mejor toma de decisiones. Por lo cual, para la organización es relevante incluir diversas fuentes de información para el análisis de datos. Otro aspecto importante, radica en que el manejo de grandes volúmenes de información representan ganancias económicas las cuales se ven reflejadas en aspectos como la reducción de costos y el incremento en ventas por tener la posibilidad de saber específicamente las necesidades de los usuarios . Se evidencia que la organización tiene etapas definidas

A partir de la opinión de los expertos encuestados, se considera con un 21% que la principal ganancia económica que tienen las empresas a través del conocimiento obtenido de los datos procesados y analizados en las soluciones las cuales utilicen grandes volúmenes de datos desestructurados es el incremento en las ventas ya que se dirigen los recursos de la empresa en ofrecer productos y/o servicios a usuarios específicos que requieran realmente el bien o servicio ofrecido. Los siguientes dos beneficios con un 18% cada uno es la reducciones en los costos de estudios de mercado ya que se podrán conocer las tendencias actuales del mercado y la optimización del proceso de inversión ya que se podrán conocer las tendencias del mercado y con esto realizar inversión en áreas puntuales de la empresa para responder a dichas tendencias. Según lo opinado por los expertos encuestados, en un 18% el costo invertido en talento humano y tecnología para la implementación de proyectos que involucren datos no estructurados se ve retornado para la empresa principalmente en la identificación de las necesidades específicas de los usuarios y la identificación de opciones de mejoramiento para los productos y/o servicios que ofrece la empresa. Y en un 15% en el conocimiento y visión actual que se puede tener de las tendencias del mercado. Conforme a la opinión de los expertos encuestados, se considera con un 16% para cada una, que las etapas que se tienen en cuesta dentro de MVM Ingeniería de Software S.A.S para el desarrollo de las soluciones de analítica de negocios las cuales utilizan grandes volúmenes de datos desestructurados para la toma de decisiones es la preparación e identificación de las preguntas de negocio, la obtención de datos, la preparación y transformación de los datos, el almacenamiento y el Procesamiento y análisis de información y con un 13% la etapa de visualización y generación de resultados. Respecto a la opinión de los expertos encuestados, se considera en un 25% que para las soluciones de analítica de negocio basadas en la gestión de grandes volúmenes de información desarrolladas por MVM Ingeniería de Software S.A.S el planteamiento de los requisitos de negocio se realizan a partir de la definición de requisitos funcionales y no funcionales, y en un 14% los otros aspectos tenidos en cuenta son la Diagramación de la solución implementar (diagramas de casos de uso, diagramas de estado, diagramas de secuencia, diagramas de objetos, diagrama de actividades), la Diagramación del modelo de datos inicial a implementar y la Identificación de la plataforma actual y sistemas de información con los que cuenta el cliente. A partir de la opinión de los expertos encuestados, se considera en un 16% que el aspecto de mayor importancia al momento de enfrentar una solución de analítica de negocios basada en el procesamiento de grandes cantidades de información estructurada y desestructurada es el Conocimiento de la necesidad del usuario, y en un 14% otros de los aspectos de importancia al momento de enfrentar una solución de analítica de negocios son el Conocimiento del negocio, la Variedad de fuentes de información y el Recurso humano con conocimiento y experiencia en el tema.

Page 73: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

57

Según lo opinado por los expertos encuestados, se considera necesario en un 16% respectivamente que los procesos de análisis y procesamiento de grandes cantidades de información en las soluciones de analítica de negocios que se desarrollan en MVM Ingeniería de Software S.A.S deben ser mejorados incluyendo información no estructurada porque se puede tener en cuenta todas las fuentes que generan información administrativa, financiera, comercial y de mercado dentro de la empresa, además porque permite conocer las tendencias de mercado con las cuales tienen relación el usuario, permite conocer las necesidades actuales de los usuarios en cuanto a productos y/o servicios que ofrece la empresa, se podrán enfocar los servicios y/o productos generados por la empresa para determinados grupos de clientes según sus necesidades y se obtener un mejor conocimiento de los clientes y el mercado gracias a que se analizara toda la información disponible y que ha sido generada por ellos mismos.

para el desarrollo de aplicaciones de analítica de negocios y procesos claros para identificación de las necesidades y requisitos de los clientes, lo cual es una ventaja competitiva en las soluciones que se desarrollan.

Consolidar (obtención de datos) Interpretación

De acuerdo con los expertos encuestados, las soluciones implementadas o en etapa de desarrollo de MVM Ingeniería de Software S.A.S utilizan en un 29% grandes cantidades de datos no estructurados y en un 71% se utiliza información estructurada obtenida desde bases de datos relacionales.

A partir del resultado obtenido en las preguntas relacionadas con la etapa obtención de datos y según los datos de las figuras 1, 5, 6 y 10 del punto 3.2, se evidencia que en las soluciones que desarrolla MVM Ingeniería de Software S.A.S en el contexto de la analítica de se tiene un bajo porcentaje de utilización de datos no estructurados, debido a que las fuentes de información que se emplean para la captura y almacenamiento de información son bases de datos tradicionales y con archivos planos, aunque si se integra información de varias fuentes empresariales .

Según con los expertos encuestados, en un 28% se hace necesario incluir tipos de información de bases de datos relacionales para las soluciones de analítica de negocios que desarrolla actualmente MVM Ingeniería de Software S.A.S, y en un 24% archivos planos lo cual indica que estos tipos de soluciones trabajan principalmente con información estructurada.

A partir de la opinión de los expertos encuestados, en un 19% respectivamente la información empresarial que integran Las soluciones de analítica de negocios que son desarrolladas actualmente por parte de MVM Ingeniería de Software S.A.S es de sistemas comerciales, ERP (sistemas de planificación de recursos empresariales) y CRM (sistemas para la gestión de relaciones con el cliente), y en un 14% de los sistemas de facturación. Conforme a la opinión de los expertos encuestados, se considera en un 29% que el principal tipo de información que no se tiene en cuenta por su estructura o por las limitaciones propias de la herramienta de inteligencia de negocios en las soluciones de toma de decisiones desarrollados por MVM Ingeniería de Software S.A.S es Información contenida en archivos multimedia (imágenes, audio, video), y en un 25% respectivamente la Información contenida en foros y la Información expuesta en redes sociales tampoco es tenida en cuenta dentro de las soluciones de toma de decisiones.

Consolidar (preparación y transformación de datos) Interpretación

Dentro de MVM Ingeniería de Software S.A.S el 29% de los expertos encuestados consideran que los grandes volúmenes de datos que se encuentran en forma no estructurada si representan dificultad para el desarrollo de soluciones de analítica de negocios, y por el contrario el 71% restante considera que los datos no estructurados no generan dificultades para las soluciones de analítica de negocios.

A partir de los resultados obtenidos en las preguntas relacionadas con la etapa de transformación de datos y según los datos de las figuras 2, 8 y 12 del Conforme a la opinión de los expertos encuestados, un 25% considera que la principal limitación y/o dificultad que actualmente presentan

las soluciones enfocadas en analítica de negocios para la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S es la

Page 74: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

58

limitación al seleccionar las fuentes de información de donde se obtendrán los datos a procesar, seguida en un 20% por limitación de la Información que no puede ser tenida en cuenta para ser procesada por su tipo y/o estructura.

punto 3.2, se evidencia que las soluciones desarrolladas por MVM Ingeniería de Software S.A.S en el contexto de la analítica de negocios actualmente se limitan por no incluir todas las fuentes de información disponibles debido a los datos no estructurados manejan.

Según con los expertos encuestados, en un 20% se considera que la mayor dificultad que presentan las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S, por no incluir tipos de datos desestructurados es la dificultad al tener que descartar determinadas fuentes de información por la estructura de los datos que manejan, seguida en un 15% respectivamente por otras dificultades como la dificultad al permitir solo conocimiento parcial y no general de la empresa (cliente objetivo), la dificultad al limitar el formato de los datos a procesar, la dificulta al identificar plenamente las necesidades de los clientes y la dificulta de la toma de decisiones sin conocimiento completo de la empresa y/o del mercado.

Consolidar (seguridad y almacenamiento de datos) Interpretación De acuerdo a la opinión de los expertos encuestados, en un 19% en las soluciones de analítica de negocio desarrolladas por MVM Ingeniería de Software S.A.S para la seguridad de los datos en el contexto de la gestión de grandes volúmenes de información el aspecto que más se tiene en cuenta es la integridad de la información y en un 16% respectivamente otros aspecto tenidos en cuenta para la seguridad de los datos son la protección de los niveles de accesibilidad de la información a partir de la creación y definición de perfiles y roles, las alternativas de recuperación de información y las opciones de respaldo y/o copias de seguridad de los datos.

A partir de los resultados obtenidos en las preguntas relacionadas con la etapa de seguridad y almacenamiento de datos y según los datos de las figuras 13, 14, 17, 20, 21 y 22 del punto 3.2, se evidencia que en MVM Ingeniería de Software existe una gran interés por la seguridad de la información, ya que se tienen plenamente identificadas técnicas y herramientas para el respaldo de los datos, al igual que se tiene claridad en cuanto a la arquitectura y estructura que requiere una solución de analítica de negocios enfocada en el manejo de grandes volúmenes de información. Pero el trabajo con bases de datos y

A partir de la opinión de los expertos encuestados, con un 27% respectivamente el almacenamiento en la nube (cloud computing) y los respaldos periódicos de información son las técnicas que se considera más eficientes para garantizar el respaldo y seguridad de la información de un proyecto de analítica de negocio que incluya información no estructurada, seguido en un 20% de los servidores de respaldo como técnica eficiente para el respaldo de información. Según lo opinado por los expertos encuestados, con un 24% respectivamente se considera que los aspectos más importantes al momento de plantear la arquitectura para la implementación de proyectos de analítica de negocios que involucren información de tipo Big Data es la escalabilidad y el rendimiento, y en un 19% la disponibilidad también se considera como un aspecto de importancia para la arquitectura de una aplicación que involucren información de tipo Big Data. Respecto a la opinión de los expertos encuestados, el aspecto físico considerado de mayor importancia con un 25% al momento de implementar una plataforma la cual soporte un sistema basado en analítica de negocios para el procesamiento de grandes volúmenes de información estructurada y desestructurada para la toma de decisiones son los servidores, seguido en un 18% respectivamente por las redes, los discos de almacenamiento y la memoria para el procesamiento. Conforme a la opinión de los expertos encuestados, en un 58% las bases de datos relacionales son el tipo de base de datos más utilizada en las soluciones de analítica de negocios desarrolladas dentro de MVM Ingeniería de Software S.A.S, seguida en un 17% por las bases de datos documentales, lo cual indica que no se utilizan bases de datos especializadas para el manejo de informacio9n no estructurada con lo cual se concluye que los datos de este tipo no tienen una gran implementación en las soluciones de analítica de negocios dentro de MVM Ingeniería de Software S.A.S.

Page 75: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

59

Dentro de MVM Ingeniería de Software S.A.S para el desarrollo de soluciones de analítica de negocios, un 57% de los expertos encuestado expresa que para este tipo de soluciones no se emplean herramientas especializadas para el trabajo con grandes cantidades de información estructurada y no estructurada, solo en un 29% se utiliza Hadoop como herramienta para el manejo de datos no estructurados.

herramientas especializadas en la gestión de información no estructurada es mínima.

Analizar (procesamiento y análisis de datos) Interpretación

A partir de la opinión de los expertos encuestados, con un 17% respectivamente es dentro de soluciones basadas en analítica de negocios que permitan la posterior toma de decisiones el aspecto de mayor importancia al momento de analizar información de tipo Big Data es la variedad de datos, el volumen de datos y la diversidad de fuentes de Información seguido en un 13% por la Velocidad de Procesamiento de Información.

A partir del resultado obtenido en las preguntas relacionadas con la etapa de procesamiento de datos y según los datos de las figura 7 del punto 3.2, se identifica que para MVM Ingeniería de Software es importante contar con información obtenida desde diferentes fuentes de información en las soluciones de analítica de negocios que desarrolla, ya que la variedad de datos permite obtener mayor conocimiento a través del análisis de la información. A su vez, es importante resaltar que el procesamiento de la información no estructurada representa dificultad en el análisis de datos.

Visualizar (visualización de información) Interpretación

Dentro de MVM Ingeniería de Software S.A.S, se considera en un 86% que la implementación, procesamiento, análisis y manejo de grandes volúmenes de datos en el contexto de la analítica de negocios puede mejorar la toma de decisiones.

A partir del resultado obtenido en las preguntas relacionadas con la etapa de visualización de información y según los datos de las figuras 3 y 9 del punto 3.2, se evidencia que para MVM Ingeniería de Software la cantidad y variedad de datos analizados ofrece mayor conocimiento del negocio y por ende una visión más amplia del mercado lo cual mejora el proceso de toma de decisiones.

Conforme a la opinión de los expertos encuestados, con un 11% se considera que las soluciones enfocadas en la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S si se incorpora big data podrían fortalecer los resultados ofrecidos para una mejor toma de decisiones, seguido en un 9% respectivamente por el conocimiento de tendencias, comportamientos y necesidades en el contexto del mercado actual en el cual se enfoca la empresa, un mayor conocimiento de los tipos y segmentos de clientes , la precisión en la identificación de servicios y/o productos para satisfacer necesidades de los clientes de forma específica, la identificación de múltiples variables sobre el comportamiento y desempeño de la unidad de análisis en los proyectos (clientes, ventas, costos, gastos, indicadores) y la identificación de posibles opciones de crecimiento para el negocio al conocer globalmente la aceptación de los productos y/o servicios que ofrece al empresa como otras opciones resultantes del fortalecimiento de la soluciones enfocadas en la toma de decisiones si se incorpora Big Data.

Page 76: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

60

A partir del análisis realizado a los resultados obtenidos de la aplicación de la encuesta al

personal experto en gestión de información e inteligencia de negocios de MVM Ingeniería

de Software S.A.S y el cual se detalló en la anterior tabla, a continuación de describen los

hallazgos identificados según el análisis realizado. En la tabla 23, se identifican los

principales hallazgos identificados a los resultados de la encuesta, por medio de una

matriz DOFA1.

Tabla 23. Hallazgos Identificados del Análisis a la Encuesta (Elaboración propia)

Etapa Debilidades Oportunidades Fortalezas Amenazas

Id

entif

icar

(p

lan

eaci

ón y

an

ális

is)

En el análisis y diseño para el desarrollo de las soluciones de analítica de negocios no se tiene en cuenta al información de tipo no estructurada

Si MVM Ingeniería de Software S.A.S incluye dentro de la etapa de planeación y análisis de sus soluciones la posibilidad de trabajar con tipos de datos no estructurados obtenidos desde diferentes fuentes de información, podrá satisfacer en mayor medida las necesidades de los clientes y ofrecer al mercado aplicación que integren mayores volúmenes de información y con esto optimizar los procesos de analítica de negocios ofreciendo un proceso de toma de decisiones más acertado.

Se reconoce la importancia de incluir diversas fuentes de información no estructurada en las soluciones de analítica de negocios. Se tienen etapas definidas para el desarrollo de las soluciones de analítica de negocios. Se cuenta con procesos definidos para la identificación de las necesidades y levantamiento de requisitos para el desarrollo de las soluciones de analítica de negocios. Se emplean métodos de diagramación y documentación para el diseño de las soluciones de analítica de negocios. Se reconoce la importancia del análisis de datos de tipo no estructurado para la toma de decisiones en el contexto de las soluciones de analítica de negocios.

Si MVM Ingeniería de Software S.A.S no incluye dentro de la etapa de planeación y análisis de sus soluciones la posibilidad de trabajar con tipos de datos no estructurados obtenidos desde diferentes fuentes de información estará limitando sus aplicaciones de analítica de negocios, ignorando información clave para el negocio lo cual se verá reflejado en procesos de toma de decisiones sin conocimiento pleno del mercado y de la situación actual de la empresa.

La matriz DOFA es un método que permite analizar tanto el entorno como el negocio y sus interacciones, es decir, permite trabajar con toda la

información que se puede conseguir, como herramienta permite trabajar con toda la información que posea sobre su negocio, útil para examinar sus

Debilidades internas, Oportunidades externas, Fortalezas internas y Amenazas externas (López, 2001).

Page 77: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

61

Etapa Debilidades Oportunidades Fortalezas Amenazas

Se identifican y reutilizan recursos físicos existentes para la implementación de soluciones de analítica de negocios. Se tiene conocimiento de cómo enfrentar soluciones de analítica de negocios las cuales trabajen con datos no estructurados.

Co

nso

lidar

(o

bte

nci

ón

de

dat

os)

Se trabaja en un bajo porcentaje con tipos de datos no estructurados. Se descartan fuentes de información por la estructura de sus datos lo cual implica para las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S trabajar con información limitada y ofrecer resultados parciales y no generales para la toma de decisiones.

Si MVM Ingeniería de Software S.A.S incluye diferentes fuentes de información de tipo no estructurado para el desarrollo de sus soluciones de analítica de negocios podrá procesar mayores volúmenes de información lo cual le dará un mayor conocimiento del mercado, las tendencias y comportamientos de sus clientes, generando así ventaja competitiva que le permitirá conocer las necesidades puntuales de dichos clientes.

En las soluciones de analítica de negocios se integran datos de diferentes fuentes de información empresarial lo cual permite luego del procesamiento y análisis de la información conocer el estado actual de todas las áreas de la empresa y como se pueden afectar entre sí, mejorando de esta forma el proceso de toma de decisiones.

Si MVM Ingeniería de Software S.A.S no incluye diferentes fuentes de información de tipo no estructurado para el desarrollo de sus soluciones de analítica de negocios limitara el procesamiento de información solo a unos cuantos tipos de datos lo cual al momento de analizar y tomar decisiones solo le ofrecerá conocimiento pleno del negocio y de mercado, viéndose de esta forma obligado hacer mayores estudios y análisis para conocer las necesidades puntuales de sus clientes.

Con

solid

ar (

pre

par

ació

n y

tran

sfo

rmac

ión

de

dat

os)

Los grandes volúmenes de datos que se encuentran en forma no estructurada representan dificultad para el desarrollo de soluciones de analítica de negocios.

Si MVM Ingeniería de Software S.A.S en sus procesos de transformación de datos, información de tipo no estructurada podrá desarrollar aplicaciones que soporten este tipo de datos lo cual se convierte en un aspecto clave para la

Se tiene conocimiento acerca de las herramientas, técnicas y aspectos físicos (hardware) necesarios para transformación de los datos de tipo no estructurado

Si MVM Ingeniería de Software S.A.S en sus procesos de transformación de datos no incluye información obtenida desde fuentes de datos no estructurada estará limitando sus soluciones de analítica de negocios

Page 78: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

62

Etapa Debilidades Oportunidades Fortalezas Amenazas

El uso de herramientas especializadas para trabajo con datos de tipo no estructurado es mínimo, esto se debe a que los datos de tipo no estructurado no se incluyen en gran medida en las soluciones de analítica de negocios por lo cual no genera la necesidad de implementar soluciones propias para el manejo de estos datos.

optimización de los procesos de toma de decisiones

y perdiendo oportunidades de negocio en el mercado ya que no estaría actualizado con en cuento a las tendencias de bases de datos e de inteligencia de negocios que ofrece el mercado

Co

nso

lidar

(se

gu

rid

ad y

alm

acen

amie

nto

de

dat

os)

No se utilizan bases de datos especializadas para el manejo de grandes volúmenes de información no estructurada, esto se debe a que los datos de tipo no estructurado no se incluyen en gran medida en las soluciones de analítica de negocios por lo cual no genera la necesidad de trabajar con bases de datos propias para el manejo de este tipo de información, en la actualidad las bases de datos tradicionales soportan la necesidad de MVM Ingeniería de Software S.A.S por no trabajar con datos de tipo no estructurado.

Si MVM Ingeniería de Software S.A.S en sus procesos de almacenamiento incluye herramientas y técnicas especializadas en manejo de datos de tipo no estructurado podrá crear aplicaciones que soporten este tipo de información y las cuales se podrán integrar con las actuales soluciones que ofrece el mercado y que día a día se hacen más comunes para los usuarios como la redes sociales los foros, los blogs, entre otras.

Se conocen los aspectos de seguridad necesarios para la protección y/o recuperación de datos desestructurados, lo cual le permite a MVM Ingeniería de Software S.A.S ofrecer aplicaciones seguras y garantizar la protección de la información y la recuperación de forma ágil y optima sin generar mayores reprocesos a sus clientes. Se tiene claridad en cuanto a la arquitectura y estructura que requiere una solución de analítica de negocios enfocada en la gestión de grandes volúmenes de información.

Si MVM Ingeniería de Software S.A.S en sus procesos de almacenamiento de información no estructurada no incluye herramientas especializadas en el manejo de este tipo de datos, no podrá integrase con las aplicaciones actuales del mercado y tendrá que limitarse a los tipos de datos no estructurados lo cual genera una desventaja de negocio.

Page 79: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

63

Etapa Debilidades Oportunidades Fortalezas Amenazas A

nal

izar

(p

roce

sam

ien

to y

aná

lisis

de

dat

os)

El procesamiento de la información no estructurada representa una dificultad para el análisis de datos en el contexto de las soluciones de analítica de negocios.

Si MVM Ingeniería de Software S.A.S en sus procesos de análisis de información incluye tipos de datos no estructurados morara los procesos de toma de decisiones que incluyan sus aplicaciones ay que estará teniendo en cuenta toda la información clave del negocio y así se podrán identificar falencias, fortalezas, necesidades y oportunidades.

Se reconoce la importancia de contar con información obtenida desde diferentes fuentes de información en las soluciones de analítica de negocios, lo cual permite a MVM Ingeniería de Software S.A.S en un futuro crear soluciones que procese mayores volúmenes de información y arrojen resultados más exactos para una mejor toma de decisiones.

Si MVM Ingeniería de Software S.A.S en sus procesos de análisis de información no incluye tipos de datos no estructurado los procesos de toma de decisiones que incluyen sus aplicaciones estará ofreciendo información limitada del negocio.

Vis

ual

izar

(vi

sual

izac

ión

de

info

rmac

ión

)

La información con la que se cuenta para la toma de decisiones es limitada. Toma de decisiones sin conocimiento pleno de la empresa y su estado.

Si MVM Ingeniería de Software S.A.S fortalece sus aplicaciones de analítica de negocios por medio de la gestión de grandes volúmenes de información desestructurada puede estar preparado para obtener, almacenar, procesar y analizar todo tipo de información.

Se considera que la cantidad y variedad de datos analizados mejora los procesos de toma de decisiones.

Si MVM Ingeniería de Software S.A.S no incluye dentro de sus aplicaciones de analítica de negocios información no estructurada estaría en una notable desventaja ante los desafíos y requisitos que exige el actual mercado. .

En el desarrollo de este capítulo se ha realizado el diagnostico del estado actual de la

unidad de análisis en el contexto de la gestión de grandes volúmenes de información para

la implementación de soluciones de analítica de negocios, analizando los resultados

obtenidos de partir de la aplicación del instrumento de recolección de información y

finalmente identificando tanto las debilidades, oportunidades, falencias como amenazas

que se presentan para MVM Ingeniería de Software S.A.S enfocándose en el trabajo con

datos de tipo no estructurado; Para las falencias identificadas, en el capítulo 4 se plantean

estrategias para gestión de grandes volúmenes de información las cuales buscan dar

solución a la problemática que actualmente se presenta dentro de la empresa.

Page 80: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

64

CAPITULO 4. ESTRATEGIASPARA LA GESTION DE GRANDES

VOLUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION DE ANALITICA DE

NEGOCIOS EN MVM Ingeniería de Software S.A.S

De acuerdo a la metodología planteada en el numeral 1.5, a continuación se desarrolla la

tercera etapa “Planteamiento de Estrategias”, en la cual se proponen estrategias para la

gestión de grandes volúmenes de información que incluyan tipos de datos

desestructurados, a partir del marco conceptual elaborado en el segundo capítulo, en el

cual se hizo énfasis en Big Data como tendencia de bases de datos y en el diagnóstico

realizado a la unidad de análisis en el contexto de sus aplicaciones de analítica de

negocios, descrito en el capítulo tres.

A partir de las brechas identificadas con el análisis realizado en el capítulo anterior, el

cual se enfocó en estudiar la situación actual de MVM Ingeniería de Software S.A.S en

el contexto de sus aplicaciones de analítica de negocios; A continuación se plantean

estrategias para la gestión de grandes volúmenes de información para la implementación

de solución de analítica de negocios, buscando dar solución a las brechas anteriormente

mencionadas. Las estrategias están enlazadas a las diferentes fases de la gestión de la

información, como lo son la identificación (planeación y análisis), la consolidación

(obtención, transformación, la seguridad y almacenamiento de datos), el análisis

(procesamiento y análisis de datos) y la visualización (visualización de información). En

la figura 8, se ilustran las estrategias planteadas para el manejo de grandes volúmenes de

información.

Page 81: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

65

Ilustración 8. Estrategias (Elaboración Propia)

Page 82: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

66

En la Tabla 24, se especifican en detalle cada una de las estrategias planteadas en la

ilustración 8, indicando que se obtiene de cada una y el rol responsable de ejecutarlas,

estas estrategias se agrupan por las diferentes etapas para la gestión de la información en

el contexto de los grandes volúmenes de información no estructurada, propuestas por la

metodología ICAV.

Tabla 24. Planteamiento de Estrategias (Elaboración Propia)

Etapa Estrategia Descripción Responsable Producto

Iden

tific

ar (

pla

nea

ció

n y

anál

isis

) Conocer el objetivo

empresarial

Identificar el problema o necesidad a la cual se le debe dar solución, para enfocar todos los recursos, estrategias y herramientas en conseguir este objetivo.

Analista de Información D

ocu

men

to d

e requerim

iento

s

Identificar Impacto del análisis

Reconocer los clientes y usuarios potenciales (dueños de la información), ya que a partir de ellos se obtendrá información y datos los cuales se procesaran posteriormente y son a quienes llegara el análisis y resultado final del procesamiento de la información.

Analista de Información

Co

nso

lidar

(o

bte

nci

ón

de

dat

os) Identificar fuentes

de información

Identificar y seleccionar las fuentes de información internas y externas útiles al negocio enfocándose en dar solución al problema planteado. Se deben conocer los diferentes sistemas y/o aplicaciones que generan datos de valor alineados con la problemática identificada para tener en cuenta toda la información que ayudara al análisis y a la obtención de resultados.

Analista de Información C

olecció

n d

e dato

s recolectado

s

Identificar técnicas de recolección de

datos

Seleccionar las técnicas de recolección de datos más adecuadas enfocándose en dar solución al problema planteado

Arquitecto de Información

Validar accesibilidad y

permisos

Constatar que se cuente con los accesos requeridos y permisos necesarios para obtener los datos que se requieren para el análisis a realizar.

Arquitecto de Información

Page 83: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

67

Etapa Estrategia Descripción Responsable Producto

Identificar información requerida

Identificar qué datos son realmente necesarios para dar solución a la problemática planteada, ya que de esta forma se enfocara esta etapa en obtener solo la información realmente importante para el problema en cuestión, optimizando esfuerzos y tiempo.

Analista de Información /

Cliente / Usuario

Identificar crecimiento de

datos

Conocer la cantidad de datos actuales con los que cuenta el negocio y los cuales se van a ser procesados, adicionalmente identificar el aumento periódico de estos datos y la velocidad con la que crecen. Con esta información, se determina la capacidad de almacenamiento y escalabilidad se requiere en el proyecto para dar solución al problema planteado.

Arquitecto de Información

Esp

ecificacion

es de la cap

acidad d

e alm

acenam

iento

Identificar herramientas de

almacenamiento de información

Determinar la capacidad de almacenamiento necesaria que requiere la solución a implementar para identificar de esta forma las herramientas para el almacenamiento de los datos, se debe tener en cuenta aspectos como el costo, la escalabilidad de la herramienta, la seguridad, la capacidad y la accesibilidad.

Arquitecto de Información

Esp

ecificacion

es de

herram

ientas d

e alm

acenam

iento

Co

nso

lidar

(tr

ansf

orm

ació

n d

e d

ato

s)

Validar información

Validar la veracidad de la información que se obtuvo en la etapa anterior y que será analizada posteriormente para la generación de resultados, ya que esto garantizara que se está trabajando con información real la cual otorgara resultados verídicos y confiables

Analista de Información /

Cliente

Co

lección

de d

atos tran

sform

ado

s

Interpretar información

Identificar el talento humano interno de la organización que tiene amplios conocimiento de la empresa y su entorno y puede interpretar de datos propios del negocio

Cliente / Usuario

Page 84: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

68

Etapa Estrategia Descripción Responsable Producto

Validar estructura de información

Identificar la estructura adecuada que deben tener los datos para la herramienta de almacenamiento que se va a utilizar, con esto se busca eliminar posibles problemas al momento de almacenar la información. Adicionalmente se debe garantizar en este punto la consistencia e integridad de la información una vez se haya transformado

Analista de Información

Co

nso

lidar

(se

gu

rid

ad y

alm

acen

amie

nto

de

dat

os)

Plantear opciones de almacenamiento

Identificar otras opciones de almacenamiento de la información dependiendo de la necesidad del usuario y de la estructura del negocio. Por ejemplo se puede considerar el almacenamiento virtual (almacenamiento en la nube) cuando se trabaja con un cliente que posee varias sedes o almacena datos desde diferentes lugares al tiempo.

Arquitecto de Información

Co

lección

de d

atos alm

acenado

s

Seguridad de información

Determinar las acciones para garantizar la seguridad y persistencia de la información al ser almacenada. Por lo cual, es necesario contar con un plan de seguridad que ofrezca opciones de recuperación de información y restablecimiento de la misma

Arquitecto de Información / Analista de Información

Plan

de seg

urid

ad y

recup

eración d

e la in

form

ación

An

aliz

ar (

pro

cesa

mie

nto

y a

nál

isis

de

dat

os)

Enfocar análisis

Analizar la información correspondiente a la problemática, con el objetivo de identificar las variables claves y así se puede enfocar el estudio de los datos en éstas, con lo cual se garantice una solución a partir del alcance planteado.

Analista de Información

Co

lección

de in

form

ación p

rocesada

Procesar en paralelo

Implementar sistemas que permitan procesamiento de la información en paralelo para optimizar el análisis de datos haciendo este proceso más rápido y ágil.

Arquitecto de Información

Page 85: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

69

Etapa Estrategia Descripción Responsable Producto

Identificación de técnicas

Identificar las técnicas de análisis de datos más adecuadas para suplir la necesidad del problema planteado, por ejemplo técnicas como: Reglas de Asociación, Clasificación, Minería de Datos, Modelos de Predicción, Algoritmos Genéticos, Redes Neuronales, entre otras.

Arquitecto de Información

Priorizar Información

Priorizar la información según su relevancia, es decir, se recomienda analizar primero la información obtenida desde fuentes internas al negocio y posteriormente desde fuentes externas, ya que estas últimas pueden generar información que no está totalmente centrada en el negocio y pueden distorsionar el enfoque que se tiene para dar solución al problema planteado.

Analista de Información

Analizar en tiempo real

Analizar la información en el momento en que llega al sistema, esto ofrece resultados totalmente actualizados dando una visión certera y actualizada del estado del negocio o de la situación que se evalúa.

Arquitecto de Información

Identificar herramientas de

procesamiento de información

Evaluar las herramientas de software y hardware necesarias que permitan el procesamiento ágil de grandes volúmenes de información enfocándose en dar solución al problema planteado

Arquitecto de Información

Comunicación

Es necesario establecer comunicación definiendo estándares y patrones entre quienes procesan y analizan los datos y quienes los van a utilizar como materia prima para su trabajo diario, ya que es necesario conocer que información es la que esperan los usuarios y enfocarse en esto para satisfacer sus necesidades.

Analista de Información /

Cliente / Usuario

Page 86: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

70

Etapa Estrategia Descripción Responsable Producto V

isu

aliz

ar (

visu

aliz

ació

n d

e in

form

ació

n)

Identificar periodicidad

Se debe identificar la periodicidad que el usuario requiere tener a su alcance los resultados generados del análisis de la información, esto es conocer con qué frecuencia espera el usuario que la información se refresque en sus sistemas de visualización.

Analista de Información

Resu

ltado

s

Identificar responsables

Se deben identificar responsables por unidades de trabajo o áreas de trabajo para saber qué información se le debe entregar a cada persona o área, con esto se busca dar a conocer a cada persona lo que realmente necesita y no caer en el error de dar más información de la necesaria lo cual puede distorsionar el objetivo de análisis.

Analista de Información

Identificar herramientas de visualización y/o

presentación

Se deben identificar herramientas para la generación de reportes y visualización grafica de la información enfocándose en dar solución al problema planteado, es importante buscar mejorar la forma de mostrar la información enfatizando en conclusiones, esto facilita la toma de decisiones en la empresa.

Arquitecto de Información

Accesibilidad y la fluidez

Aplicar o implementar sistemas de búsqueda a partir de la información procesada y analizada para mejorar de la accesibilidad y la fluidez de la información dentro de la propia empresa.

Analista de Información

Usabilidad

Implementar sistemas de visualización usables los cuales contengan la información distribuida enfocándose en dar solución al problema planteado y permitiendo la fácil identificación de variables y puntos objetivos.

Arquitecto de Información / Analista de

Información / Cliente / Usuario

En la tabla 25, se describen los diferentes roles propuestos con sus respectivas

responsabilidades, para llevar a cabo las estrategias propuestas para la gestión de grandes

Page 87: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

71

volúmenes de información en el contexto de soluciones de analítica de negocios en la

unidad de análisis.

Tabla 25. Descripción de Roles (Elaboración Propia)

Rol Descripción Responsabilidades

Analista de Información

El analista de información se encarga de la definición de requisitos funcionales y no funcionales a partir de la identificación de la necesidad del cliente. Además debe enfocar todos los recursos y herramientas para conseguir el objetivo planteado y velar por el correcto manejo de la información durante todo el proceso de desarrollo y finalmente validar que los resultados generados son coherentes con lo esperado por el cliente y/o usuario

• Identificar problema y/o necesidad del

cliente / usuario a partir de la elaboración de las preguntas de negocio.

• Identificar los clientes potenciales para el negocio, es decir, clientes quienes tengan una necesidad que puede ser suplida por los productos y/o servicios que ofrece la empresa.

• Identificar fuentes de información

internas y externas.

• Identificar datos de importancia para el negocio.

• Constatar la veracidad de la

información.

• Validar la seguridad y persistencia de la información.

• Identificar las variables claves para

enfocar el estudio de la información.

• Identificar la periodicidad para la generación de resultados (informes).

• Identificar responsables por unidades

de trabajo.

• Velar por la usabilidad de las soluciones a implementar.

Arquitecto de Información

El arquitecto de información tiene la responsabilidad de definir e implementar la estructura en cuanto al software y hardware que se requieren para el desarrollo de

• Identificar las técnicas de análisis y

recolección de datos.

Page 88: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

72

la solución. A su vez, tiene el deber de velar por la seguridad e integridad de los datos y garantizar aspectos como los tiempos de respuesta y disponibilidad de las soluciones.

• Validación de accesos y permisos para las aplicaciones que intervengan dentro de la solución a implementar.

• Identificación del crecimiento de los

datos en el tiempo, según el número de usuarios que interactuaran y la disponilidad de la solución.

• Identificar capacidades y opciones de

almacenamiento.

• Garantizar la seguridad y persistencia de la información.

• Identificar las herramientas de

software y hardware para el procesamiento de información.

• Identificar herramientas para la

generación de reportes y visualización grafica de la información.

Cliente

El cliente (persona natural o jurídica) que expone una necesidad o problemática, a resolver, adicionalmente es quien se encarga de suministrar la información necesaria del negocio y los datos con los cuales se va a trabajar.

• Comunicar necesidad del negocio

• Apoyar el proceso de identificación de

requisitos funcionales y no funcionales del negocio.

• Identificar información necesaria y

clave para el negocio.

• Apoyar el proceso de validar la veracidad de la información.

• identificar el recurso humano interno

de la empresa con conocimientos requeridos para dar solución al problema planteado.

• Velar por la buena comunicación con

el equipo de trabajo.

• Apoyar procesos y tareas enfocadas en la usabilidad de los sistemas.

Page 89: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

73

Usuario

El usuario (persona natural o jurídica) es quien utiliza la solución implementada en su trabajo diario, encargado consciente o inconscientemente de generar datos reales los cuales procesara y analizara la aplicación para la generación de resultados que permitan la toma de decisiones.

• Apoyar el proceso de identificación de

requisitos funcionales y no funcionales del negocio.

• Velar por la buena comunicación con el equipo de trabajo.

• Apoyar procesos y tareas enfocadas en la usabilidad de los sistemas

Una vez identificadas las falencias que presenta la unidad de análisis en el contexto de las

aplicaciones de analítica de negocios a partir del estudio realizado en el capítulo 3 y del

planteamiento de estrategias para la gestión de grandes volúmenes de información

detallas en la ilustración 8 y tabla 24 de presente capítulo, a continuación se realiza el

mapeo entre las brechas identificadas y as estrategias planteadas. En la tabla 26, se realiza

el mapeo entre las falencias identificadas en la unidad de análisis y las estrategias

planteadas.

Tabla 26. Falencias Identificadas y Estrategias de Solución (Elaboración Propia)

Etapa Falencia Estrategia Solución Estrategia

Identificación (planeación y

análisis)

Información descartada en el

análisis y diseño de soluciones

Conocer el objetivo empresarial

Conociendo claramente la necesidad del cliente se sabrá si la información de tipo no estructurada debe ser tenida en cuenta y de ser así los procesos de análisis y diseño al deben incluir.

Identificar Impacto del análisis

Consolidación (obtención de

datos)

Fuentes de Información Limitadas

Identificar información requerida

Se identificaran otras fuentes de información que ofrezcan más datos para la solución de analítica de negocios

Identificar fuentes de información

Fuentes de Información Descartadas

Identificar técnicas de recolección de datos Se contara con las técnicas y

herramientas adecuada s que permitan tener en cuenta fuentes de información que generen datos no estructurados.

Identificar herramientas de almacenamiento de información

Identificar herramientas de procesamiento de información

Consolidación (transformación

de datos)

Dificultad en el desarrollo de soluciones de analítica de

negocios por los

Identificar herramientas de almacenamiento de información

Se identificaran y utilizaran las herramientas necesarias para trabajar con datos de tipo no estructurado sin que esto presente algún tipo de

Validar estructura de información

Page 90: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

74

Etapa Falencia Estrategia Solución Estrategia

datos de tipo desestructurados

Identificar herramientas de procesamiento de información

dificultad en el desarrollo de soluciones de analítica de negocios.

Identificar herramientas de visualización y/o presentación

No se usan herramientas

especializadas para datos de tipo

desestructurado

Identificar herramientas de almacenamiento de información

Con la utilización de datos de tipo no estructurado se implementaran las herramientas especializadas en el manejo de estos datos.

Identificar herramientas de procesamiento de información

Consolidación (seguridad y

almacenamiento de datos)

No se usan bases de datos

especializadas para datos de tipo

desestructurado

Validar estructura de información

Con la utilización de datos de tipo no estructurado se implementaran las bases de datos especializadas en el manejo de estos datos.

Identificar herramientas de almacenamiento de información

Análisis (procesamiento y análisis de datos)

Dificultad en el procesamiento y

análisis de datos de tipo

desestructurado

Validar estructura de información

Al utilizar las herramientas y técnicas enfocadas en los datos de tipo no estructurado, esta información no representara una dificultada al momento de procesarla.

Identificar herramientas de procesamiento de información

Identificación de técnicas

Información descartada

Identificar técnicas de recolección de datos

La implementación de las herramientas adecuadas en las diferentes etapas de la gestión de la información y de las técnicas de recolección de datos de tipo no estructurado permitirán analizar gran cantidad de información evitando que aluna de esta se tenga que descartar por su estructura.

Validar estructura de información Identificar herramientas de almacenamiento de información

Identificación de técnicas

Identificar herramientas de procesamiento de información

Volumen de información

limitado

Identificar herramientas de almacenamiento de información

Las herramientas adecuadas para el almacenamiento y procesamiento de la información permitirán manejar mayores volúmenes de datos.

Identificar herramientas de procesamiento de información

Tiempos de respuesta no

óptimos

Identificar herramientas de almacenamiento de información

Al utilizar técnicas que permitan el procesamiento de información en paralelo además de implementar las herramientas que se enfoquen en el trabajo con grandes volúmenes de información se podrán mejorar los tiempos de respuesta de las soluciones de analítica de negocios.

Procesar en paralelo

Identificar herramientas de procesamiento de información

Identificar crecimiento de datos

Analizar en tiempo real

Page 91: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

75

Etapa Falencia Estrategia Solución Estrategia

Visualización (visualización de

información)

Toma de decisiones a partir

de información limitada

Identificar fuentes de información

La correcta selección de las fuentes de datos como las técnicas de recolección de información apropiadas en conjunto con las herramientas enfocadas en el manejo de grandes volúmenes de información permitiría procesar mayores volúmenes de información de diferente tipo para tener un conocimiento más amplio del negocio.

Identificar técnicas de recolección de datos

Identificar herramientas de almacenamiento de información

Identificar herramientas de procesamiento de información

Identificar herramientas de visualización y/o presentación

Toma de decisiones a partir de conocimiento

parcial

Conocer el objetivo empresarial

La identificación de los aspectos claves para la implementación de soluciones de analítica de negocios, como conocer el objetivo empresarial, las herramientas adecuadas y conocer que espera el cliente del sistema es clave para que el proceso final de toma de decisiones se realice con conocimiento de todas las variables e información disponible.

Identificar fuentes de información Identificar información requerida Identificar herramientas de almacenamiento de información

Identificar herramientas de procesamiento de información

Identificar herramientas de visualización y/o presentación

Identificar periodicidad Identificar responsables

Page 92: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

76

CAPITULO 5. CONCLUSIONES, LECCIONES APRENDIDAS Y

RECOMENDACIONES

5.1 Conclusiones De acuerdo con los objetivos planteados en el presente estudio de caso, se puede concluir

que la gestión de grandes volúmenes de información es clave para la generación de

conocimiento dentro de las empresas, lo cual además de convertirse en una ventaja

competitiva permite una mejor toma de decisiones. Una empresa como MVM Ingeniería

de Software S.A.S la cual desarrolla soluciones de analítica de negocios para empresas

como Interconexión Eléctrica S.A. E.S.P. (ISA), Empresas Públicas de Medellín (EPM),

ISAGEN, XM S.A. E.S.P., Central Hidroeléctrica de Caldas S.A. E.S.P (CHEC), UNE

EPM Telecomunicaciones S.A., entre otros, debe poseer el conocimiento necesario para

la gestión de grandes volúmenes de información obtenida desde diferentes fuentes de

información no estructurada ya que es desde aquí donde se obtiene conocimiento para

identificar tendencias y comportamientos que permiten enfocar los objetivos del negocio.

Por lo cual, es conveniente la implementación de las estrategias para la gestión de grandes

volúmenes de datos por medio de Big Data en el contexto de la analítica de negocios

propuestas en el presente trabajo. La realización del marco conceptual permitió tener las

bases teóricas y conceptuales para entender la temática de la investigación y en conjunto

con el instrumento de recolección elaborado se realizó el diagnostico a la unidad de

análisis y posteriormente el planteamiento de las estrategias para la gestión de grandes

volumen de información. Con la generación del marco conceptual adicionalmente se

identificaron las diferentes etapas del ciclo de vida de la información enfocada en los

grandes volúmenes de datos no estructurados lo cual permite que se tenga una

metodología coherente para el desarrollo de este tipo de soluciones y se lograron conocer

los aspectos de mayor relevancia en el tratamiento de datos de este tipo a partir de lo cual

se realizó el planteamiento de las estrategias. Igualmente con la aplicación de la encuesta

al personal experto en gestión de información de MVM Ingeniería de Software S.A.S se

evidencio que dentro de la empresa se tienen la conciencia de la importancia que

representa el procesamiento de grandes cantidades de información no estructurada para

Page 93: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

77

la toma de decisiones, se tiene claro la estructura física y conceptual con la que se deben

abordar las aplicaciones de analítica de negocios que incluyan datos de este tipo y se

poseen conocimientos amplios en cuanto a la seguridad de la información y los elementos

que se deben tener en cuenta para este punto, pero en las soluciones que actualmente se

desarrollan la utilización de la información no estructurada es mínima ya que se considera

que estos tipos de datos son una dificultad para la implementación de las aplicaciones, las

fuentes de información a partir de la cuales se obtienen los datos para analizar se limitan

por el tipo de información que generan, la utilización de herramientas y bases de datos

especializadas en la gestión de información de tipo no estructurada es mínima, las

cantidades de información que actualmente procesan y analizan las aplicaciones de

analítica de negocios son limitadas tanto por las fuentes de información que se emplean

como por las herramientas utilizadas y se hace necesario descarta información que puede

llegar ser clave para el negocio por su estructura.

Para la correcta implementación de las estrategias propuestas que dan solución a las

falencias identificadas se deben incorporar dentro de las soluciones de analítica de

negocios todo tipo de fuente de información que genere datos importantes para el negocio,

no solo limitarse a los orígenes de datos tradicionales como las bases de datos relacionales

y archivos planos que son los orígenes de información utilizados en actualidad para las

soluciones de analítica de negocios en MVM Ingeniería de Software S.A.S,

adicionalmente desde la etapa de análisis y diseño se debe contemplar el trabajo con datos

no estructurados para incluirlos desde el inicio en todo el proceso del desarrollo de las

soluciones, además es necesario el trabajo con herramientas y bases de datos diseñadas

especialmente para el almacenamiento, procesamiento, análisis y visualización de este

tipo de datos para permitir a la vez trabajar con mayores volúmenes de información y con

tiempos de respuesta óptimos, de esta forma MVM Ingeniería de Software S.A.S podrá

contar dentro de sus soluciones con mayores volúmenes de información que generaran

más conocimiento y una visión más amplia del negocio para el mejoramiento del proceso

de toma de decisiones.

Por último, a continuación se ilustran conclusiones adicionales producto del ejercicio

investigativo realizado:

Page 94: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

78

• Los grandes volúmenes de datos han tomado cada vez mayor importancia en el

desarrollo de los negocios y en las organizaciones, su uso es cada vez más relevante

y clave en los escenarios de evolución de las empresas, por esto la importancia del

correcto manejo y gestión de los grandes volúmenes de información

• Big Data crea valor de muchas maneras diferentes, cuando se usa correctamente

permite una mejor utilización de la información. Los datos son fundamentales para

mejorar el rendimiento y comprender mejor el contexto en que se mueven las

organizaciones, estos ayudan a entender mejor los clientes, el público y el mercado

en general. A través de los datos se puede anticipar las necesidades y conocer de una

manera más activa las demandas de los consumidores, estableciendo estrategias de

acción concretas.

• Las formas en las que a partir del tratamiento masivo de datos se pueden crear valor

son: Hacer la información transparente y utilizable más frecuentemente. Las

organizaciones que crean y almacenan más datos transaccionales en forma digital,

pueden recopilar información de rendimiento más precisa y detallada, y por lo tanto,

mejorar el rendimiento. El tratamiento masivo de datos permite la segmentación cada

vez más estrecha de los clientes y por lo tanto, los productos pueden ofrecerse de forma

más precisa. Se puede mejorar sustancialmente la toma de decisiones. Y finalmente,

el tratamiento masivo de datos se pueden utilizar para mejorar el desarrollo de la

próxima generación de productos y servicios a crear.

5.2 Lecciones Aprendidas

En el desarrollo de este proyecto de resalta como lecciones aprendidas la importancia de

la realización del marco conceptual ya que permite que se tenga un soporte teórico a la

investigación y una recopilación de información base del tema tratado, lo cual en conjunto

con el instrumento de recolección de información empleado (encuesta) permiten realizar

un diagnóstico de la unidad de análisis para conocer la problemática actual que presenta

la empresa, así como para identificar las fortalezas y falencias en cuanto a la gestión de

grandes volúmenes de información.

Page 95: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

79

5.3 Recomendaciones

Se sugiere para un próximo trabajo de investigación, implementar las estrategias para la

gestión de grandes volúmenes de datos por medio de Big Data en el contexto de la

analítica de negocios propuestas en el presente documento enfocadas en el estudio de

caso de MVM Ingeniería de Software S.A.

Page 96: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

80

REFERENCIAS

Big Data Consulting. Metodología. Recuperado de http://bigdataconsulting.wordpress.com/consulting/methodology/

Business Brio. Big Data. Recuperado de http://www.businessbrio.com/big-data.html Bustelo, Carlota & García, Elisa (2001). Tendencias en la gestión de la información, la

documentación y el conocimiento en las organizaciones.Recuperado dehttp://b3.bibliotecologia.cl/ar-tendencias.htm

Calderale, Hernán (2012). Big Data: la clave es analizar, no acumular. Recuperado de

http://www.ca.com/cl/news/press-releases/latam/2012/big-data-la-clave-es-analizar-no-acumular.aspx

CBIG Consulting. CBIG Framework. Recuperado de

http://www.cbigconsulting.com/approach/big-data-analytics-framework/ Centro de Telemedicina de Colombia (2014). Tecnologías de la Información y las

Comunicaciones TIC's. Recuperado de http://www.colombiantelemed.com/index2.php?option=com_content&do_pdf=1&id=27

Computerworld (2012). Big Analytics, la evolución de BI y Business Analytics.

Recuperado dehttp://www.computerworldmexico.mx/Articulos/22988.htm Developer Works. ¿Qué es Big Data?.Recuperado de

http://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/ Diario de Tecnología Empresarial (2013). Tres casos de éxito de Big Data en

Colombia.Recuperado de http://empresas.it/2013/05/tres-casos-de-exito-de-big-data-en-colombia/

Dyche, Jill (2013). Los siete pasos de la entrega del big data. Recuperado de

http://www.sas.com/offices/europe/spain/IQ/Q113/EMPEZARCONELBIGDATA.pdf

Page 97: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

81

Fernández, Elmer. Entendimiento de los Datos. Recuperado de http://www.uccor.edu.ar/paginas/seminarios/Cursos/DM-Medicine/Phase2-b.pdf

Fidelity Worldwide Investment (2012). Big data: una "revolución industrial" en la

Gestión de los datos digitales. Recuperado de https://www.fondosfidelity.es/static/pdfs/informes-fondos/Fidelity_ArgInvSXXI_BigData_Sept12_ES.pdf

Figueroa Andrinis, Ingrid Francis. Definición de TIC. Recuperado de

http://www.creadess.org/index.php/comparte/2012-02-10-21-38-04/blogs-creadess/pdf?id=5733

García Orozco, Javier Francisco. Gestión de la Información y el Conocimiento.

Recuperado de http://www.observatoriovirtual.udg.mx/_documentos/Gestiondelconocimiento_Javier%20Garcia-1.pdf

Góngora, Genny. Tecnología de la información como herramienta para aumentar la

productividad de una empresa. Recuperado de http://www.tuobra.unam.mx/publicadas/040702105342.html

Ibermatica (2011). El tratamiento masivo de datos (Big Data): La próxima frontera para

la innovación, la competencia, y la productividad. Recuperado dehttp://rtdibermatica.com/?p=319

Information Management. ¿Qué es la gestión de la información?.Recuperado de

http://informationmanagement.wordpress.com/2006/11/28/%C2%BFque-es-la-gestion-de-la-informacion-3-de-4/

Innovation Edge (2013). BBVA y Big Data. Recuperado

dehttps://www.centrodeinnovacionbbva.com/innovation-edge/21-big-data/p/156-bbva-y-big-data

Martínez Carazo. Estudio de caso. Recuperado

dehttp://www.udlap.mx/intranetWeb/centrodeescritura/files/notascompletas/estudiodeCaso.pdf

Presidencia de la República (2010). Gestión de la Información. Recuperado de

http://www.accioncontraminas.gov.co/accion/Paginas/GestionInformacion.aspx

Page 98: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

82

Pomares, Alexandra (2013). Uno. Inteligencia analítica en el sector salud. Recuperado

de http://acis.org.co/revistasistemas/index.php/component/k2/item/146-uno-inteligencia-anal%C3%ADtica-en-el-sector-salud

Rodríguez, José Manuel. Seguridad ante el fenómeno Big Data. Recuperado de

http://www.redseguridad.com/empresas/fabricantes/seguridad-ante-el-fenomeno-big-data

Rodríguez Salas, Karla (2012). Gestión De La Información En Las Organizaciones.

Recuperado de http://www.accioncontraminas.gov.co/accion/Paginas/GestionInformacion.aspx

Ruiz Blanco, Gabriel (2012). Tecnologías De Información Y Comunicación. Recuperado

de http://www.buenastareas.com/ensayos/Tecnologias-De-Informacion-y-Comunicacion/6084522.html

Saima (2013). Business Intelligence y Big Data, ¿independencia o

cooperación?.Recuperado de http://www.saimasolutions.com/blog/business-intelligence-big-data/

Thompson, Iván. Definición de Información. Recuperado de

http://www.promonegocios.net/mercadotecnia/definicion-informacion.html Yacuzzi, Enrique. El Estudio De Caso Como Metodología De Investigación: Teoría,

Mecanismos Causales, Validación. Recuperado de http://www.ucema.edu.ar/publicaciones/download/documentos/296.pdf

Zarahi, Murillo &Maria, Castro. & Brenda, Solis. & Tania Ronquillo (2011).Enfoques Cuantitativo Y Cualitativo De La Investigación En Ciencias Sociales.Recuperado de http://www.tlalpan.uvmnet.edu/oiid/download/Enfoques%20cualitativo%20cuantitativo_04_CSO_PSIC_PICS_E.pdf

Page 99: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

83

ANEXOS

Page 100: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

84

ANEXO A. ENCUESTA

Propósito: En el marco de la especialización de Gestión de Información y Bases de Datos de la Universidad de San Buenaventura (seccional Medellín), los profesionales Isabel Cristina Gómez Diaz y Esneyder Ardila Cañas se encuentran desarrollando su proyecto de grado, que tiene como propósito realizar una investigación de tipo cualitativa, donde se emplea el método de estudio de caso y la unidad de análisis es la empresa MVM Ingeniería de Software S.A.S, con el objetivo de plantear Estrategias para la Gestión de Grandes Volúmenes de Datos por Medio de Big Data en el Contexto de la An alítica de Negocios: Caso MVM Ingeniería de Software S.A.S. Los resultados que se obtengan en esta investigación, MVM podrá recibirlos como insumos para tenerlos en cuenta en los proyectos que desarrolla en el contexto de la analítica de negocios. A su vez, sus contribuciones serán importantes para el proceso de desarrollo académico de los profesionales involucrados en esta investigación. Por último, la información que se obtenga será manejada bajo estricta confidencialidad y solo tendrá los fines académicos antes mencionados. Objetivo: El objetivo de este instrumento de recolección de información (tipo encuesta) es conocer la opinión de expertos de MVM Ingeniería de Software S.A.S en el contexto de la gestión de gestión de la información y analítica de negocios, con el fin de recibir sus contribuciones en relación a la gestión de grandes volúmenes de información estructurada y desestructurada para la implementación de soluciones y/o proyectos de Big Data. Preguntas: Las preguntas de la 1 a la 3 son de tipo única resp uesta. Se debe seleccionar solo una de las opciones presentadas. 1. ¿En la actualidad las soluciones implementadas o que se encuentran en

etapa de desarrollo por parte MVM Ingeniería de Software S.A.S , utilizan grandes cantidades de datos de tipo desestructurado obtenidos desde diferentes fuentes de información diferentes a las bases de datos relacionales?

Seleccione una opción.

Page 101: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

85

o Si o No

2. ¿Considera que los grandes volúmenes de datos que se encuentran en forma

desestructurada representan una dificultad para el desarrollo de soluciones de analítica de negocios dentro de MVM Ingeniería de Software S.A.S ?

Seleccione una opción.

o Si o No

3. ¿Considera que la implementación, procesamiento, análisis y manejo de

grandes volúmenes de datos (Big Data) en el contexto de la analítica de negocios puede mejorar la toma de decisiones a partir de la información ofrecida por las soluciones que actualmente desarrolla MVM Ingeniería de Software S.A.S ?

Seleccione una opción.

o Si o No

Si la respuesta de la pregunta anterior fue Si continúe por favor en la pregunta número 4 de lo contrario continúe en la pregunta 5

4. ¿Qué beneficios considera que puede ofrecer la implementación, procesamiento, análisis y manejo de grandes volúmenes de datos en el contexto de la analítica de negocios, las soluciones que actualmente desarrolla MVM Ingeniería de Software S.A.S ?

Selecciones las opciones que apliquen.

□ Mayor conocimiento del mercado a partir de la identificación de

tendencias y comportamiento de los clientes, lo cual facilitara tomar decisiones más acertadas referentes a la creación y promoción de productos y/o servicios

□ Análisis de mayores volúmenes de información permitiendo tener en cuenta diversas fuentes de datos, lo cual facilitara tomar decisiones más acertadas referentes al negocio en general

□ Conocimiento de las necesidades y preferencias de los clientes, lo cual facilitara tomar decisiones más acertadas en cuanto a la orientación de productos y/o servicios para satisfacer necesidades de los clientes de forma especifica

Page 102: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

86

□ Conocimiento y procesamiento de información interna y externa del negocio, lo cual facilitara tomar decisiones más acertadas referentes a la expansión, alianzas y oportunidades de negocio que tiene la empresa

□ Identificación de variables claves para el negocio, lo cual permitirá tomar decisiones para la empresa a partir de un análisis más detallado y especializado

□ Identificación de sistemas de información que tienen mayor influencia para los usuarios, lo cual permitirá tomar decisiones en cuanto a la necesidad de implementar nuevos sistemas de información internos y externos a la empresa

□ Otro: __________________________________________________

Las preguntas de la 5a la 23son de selección múltip le. Se debe seleccionar una o varias de las opciones ofrecidas según su res puesta. 5. Las soluciones de Analítica de Negocios que son desarrolladas actualmente

por parte de MVM Ingeniería de Software S.A.S integran información de diversas fuentes de información empresarial como.

Selecciones las opciones que apliquen.

□ Sistemas de facturación □ Sistemas comerciales □ ERP (Sistemas de planificación de recursos empresariales) □ CRM (Sistemas para la gestión de relaciones con el cliente) □ Sistemas de información gerencial □ Sistemas para el control y mejoramiento de procesos □ Aplicaciones de redes sociales □ Sistemas de medición inteligente □ Sistemas de información geográfica □ Otro: ________________________________________________

6. Para las soluciones de Analítica de Negocios que son desarrolladas actualmente por parte de MVM Ingeniería de Software se hace necesario incluir diversos tipos de información obtenida desde diversas fuentes como: Selecciones las opciones que apliquen.

□ Bases de Datos Relacionales □ Archivos Planos (.xls, .txt, .xml) □ Foros □ Videos

Page 103: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

87

□ Redes Sociales □ Imágenes □ Audios □ Blogs □ Otro: ________________________________________________

7. ¿Qué aspectos considera de mayor importancia al momento de analizar

información de tipo Big Data dentro de soluciones basadas en Analítica de Negocios que permitan la posterior toma de decisiones?

Selecciones las opciones que apliquen.

□ Variedad de Datos □ Volumen de Datos □ Velocidad de Procesamiento de Información □ Diversidad de Fuentes de Información □ Tiempos de Respuesta □ Resultados Precisos □ Seguridad de Datos □ Visualización y/o Presentación de la Información □ Otro: ___________________________________________________

8. ¿Qué limitaciones y/o dificultades considera usted que actualmente

presentan las soluciones enfocadas en Analítica de Negocios para la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S ?

Selecciones las opciones que apliquen.

□ Tiempos de respuestas no son óptimos en cuanto a la información que se procesa para la toma de decisiones

□ Resultados con un margen de error igual o superior al 30% a partir de del análisis realizado a la información

□ Limitaciones en cuanto al volumen de información a procesar para la posterior toma de decisiones

□ Limitaciones al seleccionar las fuentes de información de donde se obtendrán los datos a procesar

□ Selección detallada de los tipos de datos que se procesaran □ Información que no puede ser tenida en cuenta para ser procesada por

su tipo y/o estructura □ Bajos niveles de seguridad para la integridad, confiabilidad y

accesibilidad de la información □ Otro: ___________________________________________________

Page 104: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

88

9. ¿De qué manera considera usted que podrían fortalecerse los resultados ofrecidos por las soluciones enfocadas en la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S si se incorpora Big Data?

Selecciones las opciones que apliquen.

□ Mejor toma de decisiones □ Conocimiento de tendencias, comportamientos y necesidades en el

contexto del mercado actual en el cual se enfoca la empresa □ Mayor conocimiento de los tipos y segmentos de clientes □ Precisión en la identificación de servicios y/o productos para satisfacer

necesidades de los clientes de forma específica □ Identificación de necesidades propias de la empresa en el contexto del

mercado actual □ Visión general del mercado (clientes, competidores, proveedores,

aliados, etc.) □ Mejoramiento de la accesibilidad de información dentro de la empresa □ Evaluación para la creación y/o rediseño de productos y servicios

internos □ Identificación de múltiples variables sobre el comportamiento y

desempeño de la unidad de análisis en los proyectos (clientes, ventas, costos, gastos, indicadores)

□ Ampliar variables en los tableros de desempeño que se desarrollen. □ Reducción en costos relacionados con estudios de mercado ya que se

tendrá un amplio conocimiento de las necesidades y tendencias de los usuarios

□ Identificación de posibles opciones de crecimiento para el negocio al conocer globalmente la aceptación de los productos y/o servicios que ofrece al empresa

□ Identificación de posibles alianzas estratégicas al conocer a nivel global otras empresas que pueden ofrecer productos y/o servicios que complementen los propios de la empresa

□ Otro: ___________________________________________________

10. ¿En la actualidad que tipo de información no se tiene en cuenta en las soluciones de toma de decisiones desarrollados por MVM Ingeniería de Software S.A.S por su estructura o por las limitaciones propias de la herramienta de Inteligencia de Negocios?

Selecciones las opciones que apliquen.

□ Información de bases de datos relacionales □ Información de archivos planos

Page 105: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

89

□ Información de documentos de texto □ Información contenida en foros □ Información expuesta en redes sociales □ Información contenida en archivos multimedia (imágenes, audio,

video) □ Ninguna de las anteriores

11. ¿Por qué considera necesario el mejoramiento de los procesos de análisis y

procesamiento de grandes cantidades de información desestructurada en las soluciones de analítica de negocios que se desarrollan en MVM Ingeniería de Software S.A.S ?

Selecciones las opciones que apliquen.

□ Se puede tener en cuenta todas las fuentes que generan información administrativa, financiera, comercial y de mercado dentro de la empresa

□ Permite analizar todos los datos con los que cuenta la empresa □ Permite obtener resultados más acertados y precisos ya que

analizaran mayores volúmenes de información □ Permite conocer las tendencias de mercado con las cuales tienen

relación el usuario □ Permite conocer las necesidades actuales de los usuarios en cuanto

a productos y/o servicios que ofrece la empresa □ Se podrán enfocar los servicios y/o productos generados por la

empresa para determinados grupos de clientes según sus necesidades

□ Obtener un mejor conocimiento de los clientes y el mercado gracias a que se analizara toda la información disponible y que ha sido generada por ellos mismos

□ Ninguna de las anteriores □ Otro: ___________________________________________________

12. ¿En la actualidad que dificultades se presentan en las soluciones de Analítica

de Negocios que se desarrollan por parte de MVM Ingeniería de Software S.A.S, por no incluir tipos de datos desestructurados obtenidos desde diferentes fuentes de información?

Selecciones las opciones que apliquen.

□ Dificultad al no permitir el procesamiento de toda la información que genera la empresa (cliente objetivo).

Page 106: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

90

□ Dificultad al descartar determinadas fuentes de información por la estructura de los datos que manejan

□ Dificultad al permitir solo conocimiento parcial y no general de la empresa (cliente objetivo).

□ Dificultad al limitar el formato de los datos a procesar □ Dificulta al identificar plenamente las necesidades de los clientes □ Toma de decisiones sin conocimiento completo de la empresa y/o del

mercado □ Ninguna de las anteriores. □ Otro: ___________________________________________________

13. ¿Qué aspectos considera que se deben tener en cuenta en la seguridad de

los datos en el contexto de la gestión de grandes volúmenes de información en las soluciones de Analítica de Negocio desarrolladas por MVM Ingeniería de Software S.A.S ?

Selecciones las opciones que apliquen.

□ Integridad de la Información □ Protección de los niveles de accesibilidad de la información a partir de

la creación y definición de perfiles y roles □ Alternativas de recuperación de información □ Opciones de respaldo y copias de seguridad de los datos □ Implementación de sistemas de cifrado para garantizar la

confidencialidad e integridad de los datos □ Protección contra accesos ilegales a bases de datos a través de las

tareas de administración de sistemas. □ Análisis de la procedencia de los datos □ Control de acceso y seguridad de la comunicación con otros sistemas

de información □ Control de acceso desde determinadas terminales y ubicaciones

(Control de acceso granular) □ Otro: ___________________________________________________

14. ¿Cuáles técnicas y/o herramientas considera más eficientes para garantizar

el respaldo y seguridad de la información de un proyecto de analítica de negocio que incluya información desestructurada obtenida desde diferentes fuentes de información?

Selecciones las opciones que apliquen.

□ Servidores de respaldo □ Almacenamiento en la nube (cloud computing)

Page 107: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

91

□ Respaldos periódicos □ Bases de datos paralelas □ Encriptación de datos □ Otro: ___________________________________________________

15. ¿En qué aspectos considera que el conocimiento obtenido de los datos

procesados y analizados generan ganancias económicas para aquellas empresas que implementen soluciones las cuales utilicen grandes volúmenes de datos desestructurados?

Selecciones las opciones que apliquen.

□ Reducciones de los costos de publicidad ya que se conocen tanto las necesidades como los usuarios específicos a los cuales se deben dirigir los productos y/o servicios de la empresa

□ Reducciones en los costos de estudios de mercado ya que se podrán conocer las tendencias actuales del mercado

□ Incremento en las ventas ya que se dirigirán los recursos de la empresa en ofrecer productos y/o servicios a usuarios específicos que requieran realmente el bien o servicio que ofrece al empresa

□ Nivelación en precios de venta de productos ya que se tendrá un conocimiento general del mercado

□ Reducción en los costos de compra de materia prima ya que se podrán tener un mayor conocimiento del mercado específicamente de proveedores a niveles nacional e internacional

□ Optimización del proceso de inversión ya que se podrán conocer las tendencias del mercado y con esto realizar inversión en áreas puntuales de la empresa para responder a dichas tendencias

□ Otro: ___________________________________________________

16. ¿En qué aspectos considera que el costo invertido en talento humano y tecnología para la implementación de proyectos que involucren datos desestructurados se ve retornado para la empresa?

Selecciones las opciones que apliquen.

□ Mayor conocimiento del negocios □ Identificación de las necesidades específicas de los usuarios □ Visión actual de las tendencias del mercado □ Identificación de posibles clientes potenciales □ Identificación de opciones de expansión y crecimiento del negocio □ Identificación de posibles alianzas estratégicas para la empresa

Page 108: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

92

□ Identificación de opciones de mejoramiento para los productos y/o servicios que ofrece la empresa

□ Otro: ___________________________________________________

17. ¿Dentro de MVM Ingeniería de Software S.A.S cuáles aspectos son tenidos en cuenta al momento de plantear la arquitectura para la implementación de proyectos de analítica de negocios que involucren información de tipo Big Data?

Selecciones las opciones que apliquen.

□ Disponibilidad □ Escalabilidad □ Flexibilidad □ Costo □ Rendimiento □ Ninguna de las anteriores

18. ¿Cuáles de las siguientes etapas se tienen en cuenta en el desarrollo de

soluciones de analítica de negocios realizados por MVM Ingeniería de Software S.A.S, en los cuales utilizan grandes volúmenes de datos desestructurados para la toma de decisiones?

Selecciones las opciones que apliquen.

□ Preparación e identificación de las preguntas de negocio. □ Obtención de datos □ Preparación y transformación de los Datos □ Almacenamiento □ Procesamiento y análisis de información □ Visualización y generación de resultados □ Revisión periódica □ Otro: __________________________________________________

19. ¿Cuáles aspectos son tenidos en cuenta para el planteamiento de los

requisitos de negocio en las soluciones de analítica de negocio basadas en la gestión de grandes volúmenes de información desarrolladas por MVM Ingeniería de Software S.A.S?

Selecciones las opciones que apliquen.

□ Diagramación del negocio actual, utilizando para esto diagramas de casos de uso, diagramas de estado, diagramas de secuencia, diagramas de objetos, diagrama de actividades, entre otros…

Page 109: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

93

□ Diagramación de la solución implementar, utilizando para esto diagramas de casos de uso, diagramas de estado, diagramas de secuencia, diagramas de objetos, diagrama de actividades, entre otros…

□ Diagramación del modelo de datos inicial a implementar □ Implementación de técnicas de transferencia de conocimiento □ Definición de requisitos funcionales y no funcionales □ Conocimiento general del clientes (visión, misión y objetivos) □ Implementación de técnicas para el conocimiento de la necesidad

actual del cliente como reuniones, entrevistas y encuestas □ Identificación de la plataforma actual y sistemas de información con los

que cuenta el cliente □ Otro: __________________________________________________

20. ¿Cuáles aspectos físicos considera de mayor importancia al momento de

implementar una plataforma la cual soporte un sistema basado en analítica de negocios para el procesamiento de grandes volúmenes de información estructurada y desestructurada para la toma de decisiones?

Selecciones las opciones que apliquen.

□ Redes □ Servidores □ Discos de almacenamiento □ Sistemas operativos □ Virtualización □ Memoria para el procesamiento □ Herramientas de administración de requisitos □ Procesamiento en paralelo □ Otro: __________________________________________________

21. ¿Qué tipos de bases de datos se han implementado en las soluciones de

analítica de negocios desarrolladas dentro de MVM Ingeniería de Software S.A.S los cuales involucran grandes cantidades de información estructurada y desestructurada?

Selecciones las opciones que apliquen.

□ Bases de datos relacionales □ Bases de datos documentales □ Bases de datos en grafo □ Bases de datos clave/valor □ Bases de datos multivalor

Page 110: ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE …

94

□ Bases de datos orientadas a objetos □ Bases de datos tabulares □ Ninguna de las anteriores.

22. ¿Qué herramientas son utilizadas dentro de MVM Ingeniería de Software

S.A.S para el desarrollo de soluciones de Analítica de Negocios los cuales incluyen grandes cantidades de información estructurada y desestructurada?

Selecciones las opciones que apliquen

□ Hadoop □ Mongo DB □ OrientDB □ Objectivity/DB □ SimpleDB □ BigTable □ Dynamo □ CouchDB □ Ninguna de las anteriores □ Otro: __________________________________________________

23. ¿Cuáles aspectos considera de mayor importancia al momento de enfrentar

una solución de analítica de negocios basada en el procesamiento de grandes cantidades de información estructurada y desestructurada?

Selecciones las opciones que apliquen

□ Conocimiento del negocio □ Conocimiento de la necesidad del usuario □ Conocimiento de la Información interna útil al negocio □ Conocimiento de la Información externa útil al negocio □ Variedad de fuentes de información □ Infraestructura (Herramientas de software y hardware para el

procesamiento de información) □ Recurso humano con conocimiento y experiencia en el tema □ Accesibilidad a la información □ Seguridad de la información □ Otro: ___________________________________________________