estrategias para la gestiÓn de grandes volumenes de …
TRANSCRIPT
ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE DATOS POR MEDIO DE BIG DATA EN EL CONTEXTO DE LA
ANALITICA DE NEGOCIOS: CASO MVM INGENIERÍA DE SOFTW ARE S.A.S
Esneyder Ardila Cañas Isabel Cristina Gómez Díaz
Universidad de San Buenaventura Especialización en Gestión de Información y Bases de Datos
Cohorte 7 Medellín
2014
ESTRATEGIAS PARA LA GESTIÓN DE GRANDES VOLUMENES DE DATOS POR MEDIO DE BIG DATA EN EL CONTEXTO DE LA
ANALITICA DE NEGOCIOS: CASO MVM INGENIERÍA DE SOFTW ARE S.A.S
Esneyder Ardila Cañas Isabel Cristina Gómez Díaz
Trabajo de Grado para optar al Título de Especialista en Gestión de Información y Bases de Datos
Asesor ING.ESP. MSC. RICARDO ALONSO GALLEGO BURGOS
Universidad de San Buenaventura Especialización en Gestión de Información y Bases de Datos
Cohorte 7 Medellín
2014
Nota de aceptación
____________________________
Firma
Nombre:
Presidente del jurado
Firma
Nombre:
Jurado
Firma
Nombre:
Jurado
Medellín, 28 de Abril de 2014
AGRADECIMIENTOS
Aquellas personas que estuvieron durante todo esta proceso pendientes de mi avance convirtiéndose en un apoyo que me ayudo a terminar con éxito este logro profesional.
Isabel Cristina Gómez Díaz
A Dios por darme la fuerza y voluntad de terminar esta nueva etapa de mi vida que me hace crecer como profesional y persona, en segundo lugar a mi mamá, mi abuela y mi abuelo, quienes desde el cielo han estado conmigo y me han bendecido en cada etapa de mi vida. A mi familia quienes desde la distancia han estado conmigo brindando su apoyo incondicional, a ellos le agradezco todo lo que han hecho por mí. También me gustaría agradecer a mis profesores porque todos han aportado con un granito de arena a mi formación, también le agradezco mucho a mi compañera Isabel Gómez quien con su paciencia, espontaneidad y compañerismo realizamos un buen equipo para terminar este y otros trabajos. Y por último a mis amigos quienes han tenido una voz de aliento cada vez que los necesito.
Esneyder Ardila Cañas
A nuestro asesor Msc. Ricardo Alonso Gallego Burgos por el conocimiento compartido y transmitido en el desarrollo de esta investigación, por su disposición durante este tiempo y por su exigencia en crear un trabajo bien estructurado, con los lineamientos requeridos y resultados concretos.
A nuestro asesor José Eucario Parra Castrillón por asesorarnos metodológicamente en gran parte del trabajo para presentar un proyecto con éxito.
CONTENIDO
INTRODUCCION
CAPITULO 1. MARCO METODOLOGICO ............................................................. 1
_1.1 Planteamiento Del Problema .................................................................................... 1
_1.2 Justificación .............................................................................................................. 2
_1.3 Pregunta De Investigación ........................................................................................ 3
_1.4 Objetivos De La Investigación ................................................................................. 3
__1.4.1 Objetivo General ................................................................................................ 3
__1.4.2 Objetivos Específicos ........................................................................................ 3
_1.5 Alcance ..................................................................................................................... 3
_1.6 Metodología .............................................................................................................. 4
CAPITULO 2. MARCO CONCEPTUAL ................................................................... 9
_2.1 Definiciones Generales ............................................................................................. 9
__2.1.1 ¿Que son las Bases de Datos?.............................................................................. 9
__2.1.2 ¿Qué son los Datos? .......................................................................................... 10
__2.1.3 ¿Qué es la Información? .................................................................................... 11
_2.2 TIC’S: Tecnologías de la Información y Comunicación ........................................ 11
_2.3 Gestión de la Información ...................................................................................... 13
__2.3.1 Herramientas para la Gestión de la Información ............................................... 17
_2.4 Inteligencia de Negocios (BI) ................................................................................. 19
_2.5 Big Data .................................................................................................................. 24
__2.5.1 Aplicaciones de Big Data .................................................................................. 29
__2.5.2 Modelos de Negocio Big Data........................................................................... 31
__2.5.3 Metodologías Big Data ...................................................................................... 33
__2.5.4 Técnicas para el Análisis de Información Big Data .......................................... 37
_2.6 Seguridad de Información Big Data ....................................................................... 43
_2.7 Big Data Enfocada a la Inteligencia de Negocios .................................................. 45
CAPITULO 3. DIAGNOSTICO DEL ESTADO ACTUAL DE LA UNI DAD DE ANÁLISIS EN EL CONTEXTO DE LA GESTION DE GRANDES VO LUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION D E ANALITICA DE NEGOCIOS .................................................................................... 47
_3.1 Instrumento de recolección de la información ....................................................... 47
_3.2 Resultados de la encuesta ....................................................................................... 48
_3.3 Análisis de resultados ............................................................................................. 54
CAPITULO 4. ESTRATEGIASPARA LA GESTION DE GRANDES VOLUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION D E ANALITICA DE NEGOCIOS EN MVM Ingeniería de Software S.A.S ................ 64
CAPITULO 5. CONCLUSIONES, LECCIONES APRENDIDAS Y RECOMENDACIONES .............................................................................................. 76
_5.1 Conclusiones ........................................................................................................... 76
_5.2 Lecciones Aprendidas............................................................................................ 78
_5.3 Recomendaciones .................................................................................................. 79
REFERENCIAS ........................................................................................................... 80
ANEXOS ....................................................................................................................... 83
LISTA DE TABLAS
Tabla 1. Etapas de la Investigación ................................................................................ 5
Tabla 2. Primer Objetivo Específico del Proyecto ......................................................... 6
Tabla 3. Segundo Objetivo Específico del Proyecto ...................................................... 6
Tabla 4. Tercer Objetivo Específico del Proyecto .......................................................... 7
Tabla 5. Definiciones de Bases de Datos ...................................................................... 10
Tabla 6. Definiciones de Datos ..................................................................................... 10
Tabla 7. Definiciones de Información .......................................................................... 11
Tabla 8. Definiciones de TIC’S .................................................................................... 12
Tabla 9. Definiciones de Gestión de Información ........................................................ 13
Tabla 10. Herramientas de Gestión de la Información ................................................. 17
Tabla 11. Definiciones de Inteligencia de Negocios .................................................... 19
Tabla 12. Aplicaciones Inteligencia de Negocios ......................................................... 22
Tabla 13. Definiciones de Big Data .............................................................................. 24
Tabla 14. Características de Big Data .......................................................................... 26
Tabla 15. Hitos Analítica de Negocios ......................................................................... 27
Tabla 16. Ejemplos de Aplicaciones de Big Data ........................................................ 28
Tabla 17. Aplicaciones de Big Data ............................................................................. 29
Tabla 18. Modelos de Negocio Big Data ..................................................................... 32
Tabla 19. Metodologías Big Data ................................................................................. 33
Tabla 20. Técnicas para el Análisis de Información Big Data ..................................... 38
Tabla 21. Ficha Técnica Encuesta ................................................................................ 48
Tabla 22. Análisis de los resultados ............................................................................. 56
Tabla 23. Hallazgos Identificados del Análisis a la Encuesta ...................................... 60
Tabla 24. Planteamiento de Estrategias ........................................................................ 66
Tabla 25. Descripción de Roles .................................................................................... 71
Tabla 26. Falencias Identificadas y Estrategias de Solución ........................................ 73
LISTA DE ILUSTRACIONES
Ilustración 1. Ciclo de Gestión de la Información. ....................................................... 16
Ilustración 2. Fases de la Inteligencia de Negocios ...................................................... 21
Ilustración 3. Modelo de Negocio Big Data ................................................................. 31
Ilustración 4. Pasos Metodología ICAV ....................................................................... 36
Ilustración 5. Big Data Consulting Methodology ......................................................... 36
Ilustración 6. CBIG Framework ................................................................................... 37
Ilustración 7. Metodología de la Compañía Business Rio ............................................ 37
Ilustración 8. Estrategias ............................................................................................... 65
LISTA DE ANEXOS
Anexo A. Encuesta 84
GLOSARIO
ANÁLISIS: Distinción y separación de las partes de un todo hasta llegar a conocer sus
principios o elementos (Diccionario Real Academia, 2001).
ANALITICA DE NEGOCIOS: Conjunto de herramientas de software y aplicaciones de
mercado, que permiten agregar, administrar, organizar, analizar, accesar y entregar datos
estructurados y no estructurados (Worldwide Business Analytics Software, 2012).
BENEFICIO: El beneficio es un concepto positivo pues significa dar o recibir algún bien,
o sea aquello que satisface alguna necesidad (Diccionario Real Academia, 2001).
BASE DE DATOS: Es el conjunto de informaciones almacenadas en un soporte legible por
ordenador y organizadas internamente por registros (formado por todos los campos referidos
a una entidad u objeto almacenado) y campos (cada uno de los elementos que componen un
registro). Permite recuperar cualquier clase de información: referencias, documentos
textuales, imágenes, datos estadísticos, etc. (Pinto, 2011).
BIG DATA: Es la tendencia en el avance de la tecnología que ha abierto las puertas hacia
un nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para describir
enormes cantidades de datos (estructurados, no estructurados y semi estructurados) que
tomaría demasiado tiempo y sería muy costoso cargarlos a una base de datos relacional para
su análisis. De tal manera que, el concepto de Big Data aplica para toda aquella información
que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales
(Barranco, 2012).
CLOUD COMPUTING : Entorno en el que es posible almacenar diferentes tipos de
contenido o aplicaciones, sin tener que disponer de una infraestructura propia que lo
mantenga. Es la posibilidad de utilizar servicios en la Red sin disponer de la estructura
necesaria que hace falta para mantener y ofrecer este tipo de servicio (Oliver, 2012).
COMPORTAMIENTO: Se considera como comportamiento todo lo que el individuo hace
o dice, independientemente de que sea o no observable. Segundo, aunque todo
comportamiento implica necesariamente actividad biológica del organismo, no es reductible
a dicha actividad biológica. Tercero, los estados biológicos del organismo y la actividad
reactiva propia de sus células o sistemas, no deben considerarse como un fenómeno
psicológico. Cuarto, el comportamiento implica siempre la actividad del individuo en
relación con el medio (que puede ser el propio organismo o el entorno físico o social), por
lo que no puede definirse ni comprenderse si se reduce exclusivamente a la actividad o
respuesta del organismo. Y quinto, la relación que se establece entre la actividad del
organismo y su medio es variable (Fernandez, 1997).
ESTRATEGIA : Conjunto de acciones planificadas sistemáticamente en el tiempo que se
llevan a cabo para lograr un determinado fin o misión (Magana, 2013).
HERRAMIENTA: Subprograma o módulo encargado de funciones específicas y afines
entre sí para realizar una tarea. Una aplicación o programa puede contar con múltiples
herramientas a su disposición. Por ejemplo, el corrector ortográfico puede ser una
herramienta en una aplicación para redactar documentos, pero no es una aplicación en sí
misma (Alegsa, 1998).
INFORMACIÓN: La información es un conjunto de datos acerca de algún suceso, hecho
o fenómeno, que organizados en un contexto determinado tienen su significado, cuyo
propósito puede ser el de reducir la incertidumbre o incrementar el conocimiento acerca de
algo (Thompson, 2008).
INFORMACION NO ESTRUCTURADA : Toda aquella información electrónica creada
u obtenida por los usuarios finales que no es almacenada en tablas de bases de datos
relacionales: puede incluir e-mails, documentos ofimáticos, pdf, hojas de cálculo,
presentaciones, documentos gráficos, audiovisuales, etc. (Garcia, 2013).
INTELIGENCIA DE NEGOCIOS: Es una estrategia empresarial que persigue
incrementar el rendimiento de la empresa o la competitividad del negocio, a través de la
organización inteligente de sus datos históricos (transacciones u operaciones diarias),
usualmente residiendo en Data Warehouse corporativos o Data Marts departamentales
(López, 2013).
INTERNET: Es una gran red internacional de ordenadores. Permite, como todas las redes,
compartir recursos. Es decir: mediante el ordenador, establecer una comunicación inmediata
con cualquier parte del mundo para obtener información sobre un tema que nos interesa, ver
los fondos de la Biblioteca del Congreso de los Estados Unidos, o conseguir un programa o
un juego determinado para nuestro ordenador. En definitiva: establecer vínculos
comunicativos con millones de personas de todo el mundo, bien sea para fines académicos
o de investigación, o personales (Cuadra, 2003).
INVESTIGACIÓN: Es un procedimiento reflexivo, sistemático, controlado y crítico que
tiene por finalidad descubrir o interpretar los hechos y fenómenos, relaciones y leyes de un
determinado ámbito de la realidad...-una búsqueda de hechos, un camino para conocer la
realidad, un procedimiento para conocer verdades parciales,-o mejor-, para descubrir no
falsedades parciales (Ander, 1992).
IT: (Tecnologías de la información) Concepto que abarca todo lo relacionado a la
conversión, almacenamiento, protección, procesamiento y transmisión de la información. El
concepto se emplea para englobar cualquier tecnología que permite administrar y
comunicar información (Romo, 2011).
METODOLOGIA: Hace referencia al conjunto de procedimientos racionales utilizados
para alcanzar una gama de objetivos (Rangel, 2007).
MINERIA DE DATOS: Campo de las ciencias de la computación referido al proceso que
intenta descubrir patrones en grandes volúmenes de conjuntos de datos. Este
proceso consiste en extraer información de un conjunto de datos y transformarla en una
estructura comprensible para su uso posterior (Granda, 2012).
PLATAFORMA: Es un sistema que sirve como base para hacer funcionar determinados
módulos de hardware o de software con los que es compatible. Dicho sistema está definido
por un estándar alrededor del cual se determina una arquitectura de hardware y
una plataforma de software (incluyendo entornos de aplicaciones). Al definir plataformas se
establecen los tipos de arquitectura, sistema operativo, lenguaje de programación o interfaz
de usuario compatibles (Santamaria, 2013).
PREDICCIÓN: Anunciar por revelación, ciencia o conjetura algo que ha de suceder
(Diccionario Real Academia, 2001).
PROCESAMIENTO DE INFORMACIÓN: Se entienden habitualmente las técnicas
eléctricas, electrónicas o mecánicas usadas para manipular datos para el empleo humano o
de máquinas (Universidad del Cauca, 2005).
REDES SOCIALES: Las redes sociales en Internet son comunidades virtuales donde sus
usuarios interactúan con personas de todo el mundo con quienes encuentran gustos o
intereses en común. Funcionan como una plataforma de comunicaciones que permite
conectar gente que se conoce o que desea conocerse, y que les permite centralizar recursos,
como fotos y vídeos, en un lugar fácil de acceder y administrado por los usuarios mismos
(Castro, 2012).
SISTEMA: Un conjunto de entidades caracterizadas por ciertos atributos, que tienen
relaciones entre sí y están localizadas en un cierto ambiente, de acuerdo con un cierto
objetivo (Juana Rincon,1995).
SOFTWARE: Software es la suma total de los programas de computadora, procedimientos,
reglas, la documentación asociada y los datos que pertenecen a un sistema de cómputo
(Lewis, 1994).
TECNOLOGÍA: La tecnología es la suma de las mediaciones entre nosotros y el mundo
natural, y la suma de las separaciones que median entre cada uno de nosotros y el otro; toda
la explotación y toxicidad necesaria para producir y reproducir el escenario de
hiperalienación en el que languidecemos. Es la textura y la forma de la dominación en
cualquier contexto de jerarquía y comercialización (Zerzan, 2001).
TOMA DE DESICIONES: Proceso mediante el cual se realiza una elección entre las
opciones o formas para resolver diferentes situaciones de la vida en diferentes contextos
(Olivares y González, 2012).
VENTAJA: Superioridad o mejoría de alguien o algo respecto de otra persona o cosa
(Diccionario Real Academia, 2001).
RESUMEN
Actualmente los volúmenes de información que genera la sociedad aumentan en gran
medida diariamente, esto debido a la incursión de nuevas tecnologías las cuales incorporan
imágenes, videos, sonidos y en general una gran cantidad de datos de tipo no estructurados,
esta situación se genera debido a causas como la incursión de redes sociales, la
implementación de transacciones comerciales y de negocios en internet, la llegada del
comercio electrónico, la creación de dispositivos móviles y la sistematización y
virtualización de actividades diarias, las cuales permiten una ágil comunicación y han
tomado fuerza en las últimas décadas siendo apalancadas por el fácil acceso a internet que
ahora se tiene y el cual con el tiempo le ha permitido a toda la sociedad interactuar de forma
rápida y optima por este medio. Para las empresas la posibilidad de obtener conocimiento a
través del análisis realizado a los datos generados por sus clientes y/o usuarios se convierte
en una ventaja competitiva ya que pueden identificar necesidades, tendencias y
comportamiento, teniendo una visión general del mercado (clientes, competidores,
proveedores, aliados, etc.), lo que significa la capacidad de una mejor toma de decisiones.
Por lo anterior, se hace importante conocer técnicas y procedimientos para la gestión de
grandes volúmenes de información, incluyendo los datos no estructurados obtenidos desde
diferentes fuentes de información internas y externas de la empresa. Por tal motivo, el
presente estudio de caso, pretende establecer Estrategias para la Gestión de Grandes
Volúmenes de Datos por Medio de Big Data en el Contexto de la Analítica de Negocios en
la organización MVM Ingeniería de Software S.A.S, buscando generar insumos para que
sean tenidos en cuenta en las soluciones que desarrolla la empresa en el contexto de la
analítica de negocios.
Palabras Clave: Datos no Estructurados, Big Data, Base de Datos, Toma de Decisiones,
Inteligencia de Negocios, Estrategia
ABSTRAC
Currently the volume of information generated by the society greatly increase daily, this due
to the introduction of new technologies which incorporate images, videos, sounds and overall
a lot of data type unstructured , this situation is generated due to causes as the incursion of
social networks, the implementation of trade and business transactions on the Internet , the
advent of electronic commerce , the introduction of mobile devices and the systematization
and virtualization daily activities , which allow quick communication and have taken hold in
decades being leveraged by the easy access to internet now has and which over time has
allowed all of society interact quickly and optimal hereby . For companies can obtain
knowledge through analysis of the data generated by your customers and / or users becomes
a competitive advantage because they can identify needs, trends and behavior, taking an
overview of the market ( customers, competitors , suppliers, partners, etc.), which means the
ability to better decision making. Therefore , it is important to learn techniques and procedures
for managing large volumes of data, including unstructured data from different sources
internal and external to the enterprise. Therefore, this case study aims to establish Strategies
for Managing Large Volumes of Data by Means of Big Data in the Context of Business
Analytics in the organization MVM Software Engineering SAS , seeking to generate inputs
that are taken into account in the solutions developed by the company in the context of
business analytics.
Keywords: Unstructured data, Big Data, Database, Decision Making, Business
Intelligence, Strategy
INTRODUCCION
El volumen de datos que se genera cada día en las organizaciones es muy alto, lo que está
ocasionando que las tecnologías de bases de datos actuales se están quedando obsoletas
rápidamente. La digitalización ha acelerado el crecimiento de los datos en todas las
organizaciones, sectores y economías sin excepción. La capacidad para almacenar,
consolidar y fusionar información ha hecho que numerosas empresas tecnológicas
construyan centros de datos para satisfacer una demanda que crece con fuerza (Fidelity
Worldwine Investiment, 2012).
Las bases de datos no son el único consolidado de datos con la que puede contar una
empresa, en la actualidad existe una gran variedad de fuentes de información que permiten
obtener mayores cantidades de datos que se encuentran almacenados en diferentes
estructuras y formatos, debido a esta situación han surgido nuevas tendencias para el manejo
de datos la cuales buscan satisfacer las necesidades actuales de la sociedad en cuanto al
manejo de grandes volúmenes información, una de ellas es Big Data la cual para muchos es
la evolución de la Inteligencia de Negocios (Becerril, 2013).
El nuevo paradigma de Big Data implica que las fuentes a partir de las cuales se obtiene una
visión profunda del mercado y las operaciones se han multiplicado. Los datos ya no sólo
provienen de las bases estructuradas tradicionales, si no de interfaces de usuarios, redes
sociales, foros, mensajes de texto y entornos diversos en los que los consumidores
interactúan día a día entre sí y con otros actores del mercado. En el contexto de Big Data,
las organizaciones se encuentran ante el desafío de incorporar información en crudo, sin
procesar, que se actualiza en tiempo real y que presenta una enorme complejidad (Calderale,
2012). La ventaja competitiva para las empresas está en lograr el procesamiento de esta
información para su posterior interpretación.
La información se convierte en parte fundamental de toda empresa para generar una ventaja
competitiva y alcanzar aspectos diferenciadores en el mercado. Por lo anterior, el presente
trabajo de investigación de tipo cualitativo, en donde se emplea el método de estudio de
caso, de acuerdo a lo propuesto por YIN (1989), en donde la unidad de análisis es MVM
Ingeniería de Software S.A.S., empresa del sector de las tecnologías de la información de
la ciudad de Medellín, tiene como objetivo proponer estrategias para la gestión de grandes
volúmenes de información incorporando un enfoque de Big Data en el contexto de la
analítica de negocios en los proyectos que esta organización desarrolla.
De acuerdo a la metodología seleccionada, se iniciará por medio de la revisión literaria sobre
tendencias para el tratamiento de grandes volúmenes de datos para elaborar un marco
conceptual en el contexto de Big Data y Analítica de Negocios, y adicionalmente se realizará
un diagnóstico para conocer el estado actual de la unidad de análisis en relación a la gestión
de grandes volúmenes de información y posteriormente analizarlo para contrarrestar la
realidad de la empresa frente a las tendencias actuales de bases de datos. El alcance
planteado en esta investigación no abarca la implementación de las estrategias planteadas
para el mejoramiento de procesos de toma de decisiones, lo que se pretende es generar
conocimiento a través del análisis realizado y plasmado en documentos físicos.
1
CAPITULO 1. MARCO METODOLOGICO
1.1 Planteamiento Del Problema El actual crecimiento de información que experimenta la sociedad presenta dificultades
en su gestión y tratamiento. Esta situación es generada ya que cada día se genera 2,9
trillones de bytes de datos, esto equivale a 5.800 millones de discos duros de ordenadores
de tamaño medio (Fidelity Worldwine Investiment, 2012). Algunas de las causas que han
originado esta dinámica, están relacionadas con el desarrollo de redes sociales, la
implementación de transacciones comerciales y de negocios en internet, la llegada del
comercio electrónico, la creación de dispositivos móviles y la sistematización y
virtualización de actividades diarias (Calderale, 2012 y Normandeau, 2013). Lo anterior
ha generado un crecimiento de la información, lo que dificulta el proceso de toma de
decisiones, el almacenamiento innecesario y la complejidad para gestionar grandes
volúmenes de información.
Las empresas se ven afectadas con esta situación ya que se hace más complejo tener una
visión global del mercado por la gran cantidad de información que se maneja y por el
formato de la misma se omiten datos que pueden ser claves para el negocio llegando a no
tener en cuenta toda la información generada desde diversas fuentes para el análisis y la
posterior toma de decisiones.
Esta situación no es ajena para MVM Ingeniería de Software S.A.S, ya que en su
portafolio de servicios, se encuentran soluciones alrededor de la analítica de negocios
para sus principales grupos de interés. Por lo cual, se hace necesario la identificación y
definición de estrategias para la gestión de grandes volúmenes de información,
incorporando los conceptos de Big Data, con los cuales puedan afrontar las limitantes
actuales en relación a la integración y gestión de fuentes de información que tienen datos
no estructurados. Dichas estrategias, se convierten en insumos que serán tenidos en cuenta
en los proyectos que desarrolla la empresa en el contexto de la analítica de negocios,
logrando así fortalecer su portafolio de servicios y soluciones, lo que significa una mayor
ventaja competitiva para la organización.
2
1.2 Justificación Esta investigación se realiza debido a que en la actualidad se cuenta con una gran variedad
de fuentes de información como interfaces de usuarios, redes sociales, foros, mensajes de
texto, imágenes, videos, entre otras, las cuales generan datos de tipo no estructurado y
esta información requiere ser procesada para la posterior toma de decisiones. Por esta
situación, las empresas demandan de técnicas que les permitan el manejo de grandes
cantidades de información de este tipo con el fin de predecir el comportamiento de un
sector en especial o de una sociedad entera y así enfocar sus procesos en dar solución a
las necesidades actuales de sus clientes. Esta investigación se basa en realizar una revisión
de la literatura para la elaboración de un marco conceptual enfocado en big data como
tendencia de base de datos en el contexto de la analítica de negocios, posteriormente
generar un diagnóstico para conocer la situación actual de MVM Ingeniería de Software
S.A.S en este contexto y finalmente plantear estrategias para el manejo de grandes
volúmenes de datos para la posterior toma de decisiones.
Con el desarrollo de esta investigación MVM Ingeniera de Software S.A.S, recibirá
insumos que le permitan realizar la adecuada gestión de grandes volúmenes de
información de una forma más acertada, por medio de las estrategias que en este
documento se plantean y las cuales puedan ser implementadas en las soluciones que la
empresa desarrolla en el contexto de la Analítica de Negocios enfocándose en el
mejoramiento de los procesos de toma de decisiones. En el desarrollo de este proyecto no
se realizara la implementación de las estrategias generadas a partir de la investigación
realizada.
Este proyecto se realiza con el cuestionamiento ¿Es posible mejorar los procesos de
tratamiento de grandes volúmenes de datos estructurados y desestructurados a partir del
trabajo con Big Data en el contexto de la Analitica de Negocios para el procesamiento
de grandes volúmenes de información y toma de decisiones en empresas del sector de las
tecnologías de la información en la ciudad de Medellín? y al finalizar el desarrollo del
mismo contar con una serie de estrategias que faciliten la gestión de grandes volúmenes
de información para la toma de decisiones.
3
1.3 Pregunta De Investigación
¿Qué estrategias para la gestión de grandes volúmenes de información deberá tener en
cuenta MVM Ingeniera de Software S.A.S en las soluciones de Analítica de Negocios
que desarrolle?
1.4 Objetivos De La Investigación
1.4.1 Objetivo General Proponer estrategias para la gestión de grandes volúmenes de información incorporando
un enfoque de Big Data en el ámbito de la analítica de Negocios en MVM Ingeniería de
Software S.A.S.
1.4.2 Objetivos Específicos • Identificar las principales tendencias para el tratamiento de grandes volúmenes de
datos, analítica de negocios y Big Data, para la elaboración de un marco conceptual
por medio de la revisión de la literatura, que sirva como soporte para el desarrollo de
la presente investigación.
• Realizar un diagnóstico para identificar el estado de MVM Ingeniería de Software
S.A.S en relación a la gestión de grandes volúmenes de información en las soluciones
de analítica de negocios que la empresa ofrece a sus grupos de interés.
• Establecer estrategias para la gestión de grandes volúmenes de información en las
soluciones de analítica de negocios que ofrece MVM Ingeniería de Software S.A.S, a
partir del diagnóstico realizado.
1.5 Alcance El alcance del presente trabajo de investigación consiste en proponer estrategias para la
gestión de grandes volúmenes de información para ser tenidas en cuenta en la
implementación de soluciones de Analítica de Negocios desarrolladas por MVM
4
Ingeniería de Software S.A.S. No se contempla la implementación de las estrategias
propuestas.
1.6 Metodología La investigación a realizar en el desarrollo de este proyecto es de tipo exploratoria
descriptiva ya que se pretende describir de forma detallada Big Data como tendencia de
base de datos enfocada a la Inteligencia de Negocios para el procesamiento de grandes
cantidades de información y la posterior toma de decisiones, y se usara un enfoque
metodológico cualitativo ya que se requiere la búsqueda y recolección de información
para construir un análisis y plantear estrategias para el mejoramiento de procesos. Esta
metodología servirá para recolectar la información requerida en la investigación y poder
determinar resultados en el proceso de interpretación de la información.
Por lo cual, se empleara el método de estudio de casos en esta investigación, según la
definición de Yin (1989), se refiere a una investigación empírica que estudia un fenómeno
contemporáneo dentro de su contexto de la vida real, especialmente cuando los límites
entre el fenómeno y su contexto no son claramente evidentes. Una investigación de
estudio de caso trata exitosamente con una situación técnicamente distintiva en la cual
hay muchas más variables de interés que datos observacionales; y, como resultado, se
basa en múltiples fuentes de evidencia, con datos que deben converger en un estilo de
triangulación; y, también como resultado, se beneficia del desarrollo previo de
proposiciones teóricas que guían la recolección y el análisis de datos.” Para esta
investigación la unidad de análisis la compone MVM Ingeniería de Software S.A.S, por
lo cual, se va a analizar su estado actual frente a prácticas con grandes volúmenes de
información en los las soluciones de Analítica de Negocios por medio un diagnóstico
usando el instrumento de la encuesta y sus resultados se van a contrarrestar con la
información resultante producto de la revisión de la literatura que se realice y con la cual
se elabore el marco conceptual, y luego con su respectivo análisis se van a proponer
estrategias para la gestión de grandes volúmenes de información. En la Tabla 1, se
describen las etapas que se abordaran en el desarrollo de la investigación.
5
Tabla 1. Etapas de la Investigación (Elaboración Propia)
Etapa Descripción Objetivo Mapeado
Elaboración de Marco Teórico
A partir de la revisión de la literatura se reúnen referentes teóricos sobre Big Data, analítica de negocios y temas afines a través de una descripción concisa que permite entender y conocer más fácilmente dichos temas, con el fin de tener conceptos que sirvan de base a la investigación a realizar.
Identificar las principales tendencias para el tratamiento de grandes volúmenes de datos, analítica de negocios y Big Data, para la elaboración de un marco conceptual por medio de la revisión de la literatura, que sirva como soporte para el desarrollo de la presente investigación.
Diagnóstico del estado actual de la unidad de análisis
Se identifica el estado actual en el que se encuentra la unidad de análisis en cuanto a la gestión de grandes volúmenes de información a través de la implementación de instrumentos como la encuesta, la cual tiene por objetivo conocer la opinión de expertos en el uso de técnicas para las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S
Realizar un diagnóstico para identificar el estado de MVM Ingeniería de Software S.A.S en relación a la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que la empresa ofrece a sus grupos de interés.
Planteamiento de estrategias
Se plantean una serie de estrategias para la optimización de procesos de gestión de grandes volúmenes de información dentro de la unidad de análisis, las cuales impacten las soluciones actuales de analítica de negocios que la empresa desarrolla mejorando los procesos de toma de decisiones.
Establecer estrategias para la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que ofrece MVM Ingeniería de Software S.A.S, a partir del diagnóstico realizado.
En la tabla 2, 3 y 4 se detallan los objetivos del proyecto y la forma como se pretenden alcanzar, mencionando las actividades, las fuentes de las cuales se obtendrán la información, las técnicas que se emplearan y los respectivos entregables de cada uno de estos.
6
Tabla 2. Primer Objetivo Específico del Proyecto (Elaboración Propia)
Objetivo
Identificar las principales tendencias para el tratamiento de grandes volúmenes de datos, analítica de negocios y Big Data, para la elaboración de un marco conceptual por medio de la revisión de la literatura, que sirva como soporte para el desarrollo de la presente investigación.
Actividades Técnicas Fuentes Entregables
• Elaboración de un
marco conceptual en el contexto de Big Data e Inteligencia de Negocios para el procesamiento de información y toma de decisiones
• Investigación acerca de Big Data como tendencia de base de datos
• Investigación acerca de la Inteligencia de Negocios como herramienta de base de datos
• Investigación acerca
del aporte de Big Data a la Inteligencia de Negocios y posibles proyecto que hayan involucrado estas herramientas en conjunto
• Revisión
Documental
• Documentos
publicados en revistas científicas
• Artículos publicados en revistas
• Libros
relacionados con el tema
Marco conceptual
Tabla 3. Segundo Objetivo Específico del Proyecto (Elaboración Propia)
Objetivo
Realizar un diagnóstico para identificar el estado de MVM Ingeniería de Software S.A.S en relación a la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que la empresa ofrece a sus grupos de interés.
Actividades Técnicas Fuentes Entregables
7
• Implementación y
aplicación de la encuesta como instrumento de recolección de información para conocer el estado actual de las soluciones de analítica de negocios desarrolladas por MVM Ingeniería de Software S.A.S.
• Análisis de los resultados obtenidos de la encuesta para determinar el estado y necesidades que presentan las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S.
• Encuesta
• Información
otorgada por expertos en la temática como: Directores de Proyectos, Analistas de Negocios, especialistas en gestión de la información y analítica de negocios, Especialistas de tecnología y Analistas de Información que formen parte del talento humano de MVM Ingeniería de SoftwareS.A.S.
Documento físico y/o digital donde se detalle la tabulación realizada a la encuesta ejecutada y en el cual se explique detalladamente cual es la necesidad y el estado actual que presentan las soluciones de analítica de negocios desarrolladas porMVM Ingeniería de SoftwareS.A.S
Tabla 4. Tercer Objetivo Específico del Proyecto (Elaboración Propia)
Objetivo Establecer estrategias para la gestión de grandes volúmenes de información en las soluciones de analítica de negocios que ofrece MVM Ingeniería de Software S.A.S, a partir del diagnóstico realizado.
Actividades Técnicas Fuentes Entregables
• Análisis comparativo de la situación actual de las soluciones de analítica de negocios desarrolladas porMVM Ingeniería de SoftwareS.A.S en relación con un marco teórico enfocado en las actuales tendencias
• Revisión
Documental
• Encuestas
• Documentos
publicados en bases de datos científicas
• Libros relacionados con el tema
• Información
Documento físico y/o digital con el listado de estrategias recomendables generadas a partir del desarrollo de la investigación para la implementación en las soluciones de analítica de negocios desarrollas por
8
de bases de datos
otorgada por expertos en la temática como: Directores de Proyectos, Analistas de Negocios, especialistas en gestión de la información y analítica de negocios, Especialistas de tecnología y Analistas de Información que formen parte del talento humano de MVM Ingeniería de SoftwareS.A.S.
MVM Ingeniería de SoftwareS.A.S
9
CAPITULO 2. MARCO CONCEPTUAL
En el presente capítulo se elabora el marco conceptual, de acuerdo a lo descrito en la
metodología propuesta en el numeral número 1.6 de este documento, en el cual se
describen las etapas a seguir para el desarrollo de la investigación.
En este capítulo se realiza la investigación acerca de Big Data como tendencia de base de
datos para la gestión de grandes volúmenes de datos obtenidos desde diferentes fuentes
de información. En la primera parte se identifican los principales conceptos sobre bases
de datos, tecnologías de la información, gestión de la información, inteligencia de
negocios y big data, posteriormente se detallan temas base para la investigación
mencionando sus principales características y aplicaciones como lo son las tecnologías
de la información y la inteligencia de negocios, y finalmente se describen y detallan los
principales aspectos de Big Data, características, campos de trabajo, metodologías y
técnicas de trabajo bajo esta tendencia de base de datos, además de la aplicabilidad que
tiene esta tendencia enfocada en la inteligencia de negocios.
2.1 Definiciones Generales
Las definiciones generales se enfocan en aclarar términos de uso común en el desarrollo
de la investigación y los cuales forman la base para entender las temáticas más relevantes
para el desarrollo de la investigación.
2.1.1 ¿Que son las Bases de Datos? Las bases de datos son una serie de datos organizados y relacionados entre sí, los cuales
son recolectados y explotados por los sistemas de información de una empresa o negocio
en particular (Valdés, 2007). En la Tabla 5, se describen otras definiciones relacionadas
con Bases de Datos.
10
Tabla 5. Definiciones de Bases de Datos (Elaboración propia)
Definición Autor
Colección o depósito de datos, donde los datos están lógicamente relacionados entre sí, tienen una definición y descripción comunes y están estructurados de una forma particular. Una base de datos es también un modelo del mundo real y, como tal, debe poder servir para toda una gama de usos y aplicaciones
(Conference Statisticiens
Européens, 1977)
Conjunto estructurado de datos registrados sobre soportes accesibles por ordenador para satisfacer simultáneamente a varios usuarios de forma selectiva y en tiempo oportuno
(Delobel, 1982)
Es una herramienta para recopilar y organizar información, una base de datos es una serie de datos organizados y relacionados entre sí, los cuales son recolectados y explotados por los sistemas de información de una empresa o negocio en particular
(Pérez, 2007)
Se define como un conjunto organizado e integrado de datos que obedece a un modelo relacional. Este modelo permite almacenar, consultar, utilizar y compartir cualquier cantidad de información permitiendo integridad, seguridad, concurrencia y accesibilidad de la misma
(Trejo, 2012)
2.1.2 ¿Qué son los Datos? Un dato es la unidad de descripción de un hecho, dispuesta de manera adecuada para su
tratamiento (Fernández, 2008).En la tabla 6, se describen otras definiciones relacionadas
con Datos.
Tabla 6. Definiciones de Datos (Elaboración propia)
Definición Autor
Un dato es un antecedente o fundamento que permite llegar más fácilmente al conocimiento de una cosa, el cual por sí mismo no tiene relevancia alguna.
(Hernández, 2005)
Un dato es un conjunto discreto, de factores objetivos sobre un hecho real o bien un registro de transacciones que por sí mismo tiene poca o ninguna relevancia o propósito.
(Hernández, 2005)
Los datos son números, letras o símbolos que describen objetos, condiciones o situaciones. Son el conjunto básico de hechos referentes a una persona, cosa o transacción de interés para distintos objetivos, entre los cuales se encuentra la toma de decisiones.
(Dip, 2009)
11
El dato es una representación simbólica (numérica, alfabética, algorítmica, etc.), una tributo o una característica de una entidad. El dato no tiene valor semántico (sentido) en sí mismo, pero si recibe un tratamiento (procesamiento) apropiado, se puede utilizar en la realización de cálculos o toma de decisiones.
(Tenjay, 2011)
2.1.3 ¿Qué es la Información? La información es un conjunto de datos acerca de algún suceso, hecho, fenómeno o
situación (Thompson, 2008). En la tabla 7, se describen otras definiciones relacionadas
con este concepto.
Tabla 7. Definiciones de Información (Elaboración propia)
Definición Autor
La información es un conjunto de mecanismos que permiten al individuo retomar los datos de su ambiente y estructurarlos de una manera determinada, de modo que le sirvan como guía de acción.
(Paoli, 1989)
La información es un conjunto de datos acerca de algún suceso, hecho o fenómeno, que organizados en un contexto determinado tienen su significado, cuyo propósito puede ser el de reducir la incertidumbre o incrementar el conocimiento acerca de algo
(Thompson, 2008)
Es un conjunto de datos con significado, o sea que reduce la incertidumbre o que aumenta el conocimiento en algo
(Chiavenato, 2009)
La información consiste en datos ordenados y seleccionados con un propósito en especifico
(Kotabe, 2009)
2.2 TIC’S: Tecnologías de la Información y Comunicación Las tecnologías de la información y la comunicación son el conjunto de tecnologías que
permiten la adquisición, producción, almacenamiento, tratamiento, comunicación,
registro y presentación de las información (Fundesco, 1986). En la tabla 8, se describen
otras definiciones relacionadas con las Tecnologías de la Información y la Comunicación
12
Tabla 8. Definiciones de TIC’S (Elaboración propia)
Definición Autor
Conjunto de tecnologías que permiten la adquisición, producción, almacenamiento, tratamiento, comunicación, registro y presentación de informaciones, en forma de voz, imágenes y datos contenidos en señales de naturaleza acústica, óptica o electromagnética.
(Guarín, 2010)
Son herramientas teórico conceptuales, soportes y canales que procesan, almacenan, sintetizan, recuperan y presentan información de la forma más variada
(López, 2011)
Son el conjunto de tecnologías desarrolladas para gestionar información y enviarla de un lugar a otro. Abarcan un abanico de soluciones muy amplio. Incluyen las tecnologías para almacenar información y recuperarla después, enviar y recibir información de un sitio a otro, o procesar información para poder calcular resultados y elaborar informes
(Ruiz, 2012)
Son aquellas herramientas computacionales e informáticas que procesan, sintetizan, recuperan y presentan información representada de la más variada forma. Es un conjunto de herramienta, soportes y canales para el tratamiento y acceso a la información, para dar forma, registrar, almacenar y difundir contenidos digitalizados.
(Centro de telemedicina de Colombia, 2014)
Las Tecnologías de la Información y Comunicación (TIC’S) hacen referencia a la
utilización de medios informáticos para almacenar, procesar y difundir todo tipo de
información. Estas se encargan del estudio, desarrollo, implementación, almacenamiento
y distribución de la información mediante la utilización de hardware y software como
medio de sistema informático (Parlamento Andino, 2012). Estas tecnologías se
desarrollan a partir de los avances científicos producidos en los ámbitos de la informática
y las telecomunicaciones (Ibarra, 2013).
Actualmente las empresas dedican una parte importante de su tiempo y de sus recursos
económicos y humanos a la obtención, procesamiento, aplicación y proyección de
información. Por esta razón, juega un papel decisivo en las organizaciones y se convierten
en un elemento importante para que se puedan alcanzar los objetivos del negocio. La
información debe ser clara, precisa y que se adapte a la formación y perfil de las personas
13
a la que va dirigida, además se ser rápida y estar disponible en el momento que se la
necesite, y de una manera completa y armonizada con otras informaciones (Abreu, 2009).
Estas tecnologías agregan valor a las actividades operacionales y de gestión empresarial
en general y permite a las empresas obtener ventajas competitivas, permanecer en
el mercado y centrarse en su negocio. Las TIC’S constituyen un instrumento fundamental
para la organización interna de cualquier negocio, utilizarlas supone un importante ahorro
de tiempo y recursos, al simplificar y agilizar los procesos de gestión, toma de decisiones
y facilitar el contacto directo con la clientela, empresas proveedoras y de administración
pública (Savio, 2013).
La implementación de las TIC’S ofrecen mejor aprovechamiento del tiempo ya que la
automatización de tareas rutinarias mediante sistemas informáticos permite dedicar más
tiempo a tareas más productivas, mejor gestión del negocio mediante aplicaciones
informáticas y determinados dispositivos electrónicos se pueden controlar todas aquellas
variables y tareas que intervienen en el negocio y reducción de la carga administrativa
gracias a las herramientas informáticas las tareas administrativas se realizan de forma
intuitiva y automatizada (Savio, 2013).
2.3 Gestión de la Información La gestión de información es el aprovechamiento de los datos, la información y el
conocimiento disponibles en las organizaciones para apoyar los procesos de negocios y
la toma de decisiones (Escuela Colombiana de Ingeniería, 2013). En la tabla 9, se
describen otras definiciones relacionadas con la Gestión de Información.
Tabla 9. Definiciones de Gestión de Información (Elaboración propia)
Definición Autor
La gestión de información es todo lo que tiene que ver con obtener la información correcta, en la forma adecuada, para la persona indicada, al costo correcto, en el momento oportuno, en el lugar indicado para tomar la acción precisa
(Woodman, 1985)
Es el proceso sistemático de buscar, organizar, filtrar y presentar la información con el objetivo de mejorar la comprensión de las personas en una específica área de interés.
(Davenport & Klahr, 1998)
14
Es el proceso sistemático de detectar, seleccionar, organizar, filtrar, presentar y usar la información por parte de los participantes de la empresa, con el objeto de explotar cooperativamente el recurso de conocimiento basado en el capital intelectual propio de las organizaciones, orientados a potenciar las competencias organizacionales y la generación de valor.
(Harvard Business Review, 2003)
La gestión de la información es el proceso que se encarga de suministrar los recursos necesarios para la toma de decisiones, así como para mejorar los procesos, productos y servicios de la organización, y cobra especial importancia en las empresas con la aparición de la informática
(Palmero, 2005)
Proceso que incluye operaciones como extracción, manipulación, tratamiento, depuración, conservación, acceso y/o colaboración de la información adquirida por una organización a través de diferentes fuentes y que gestiona el acceso y los derechos de los usuarios sobre la misma.
(Curto, 2006)
La gestión de información es una disciplina cuyo objetivo es asegurar que la organización obtiene su mayor valor de los recursos de información disponibles y que estos se gestionan de una manera eficaz y eficiente
(Mireiapm, 2010)
La Gestión de la Información, según Ponjuán (2003), es el proceso mediante el cual se
obtienen, despliegan o utilizan recursos básicos (económicos, físicos, humanos o
materiales) para manejar información. Tiene como elemento básico la gestión del ciclo
de vida de este recurso y se desarrolla en cualquier organización. La Gestión de la
Información, debido al impetuoso desarrollo de las TIC’S, sucede cada vez más en
entornos virtuales, como portales y plataformas web, y hace uso de herramientas
informáticas cada vez más sofisticadas y, al mismo tiempo, más amigables y accesibles,
por lo que los propios usuarios se convierten a menudo en gestores de información
(García, 2010).
Las primeras posturas sobre las ciencias de información aparecen en la década de los
sesenta, pero sólo a partir de los años ochenta, puede hablarse del surgimiento de la
gestión de la información como disciplina práctica (García, 2010).
La gestión de información surge como un nuevo concepto dentro del campo de la
ciencia de la información, orientado al manejo de la inteligencia corporativa de una
15
organización, que permite la estructuración interna a las empresas y les permite reaccionar
ante los cambios de su entorno apoyándose en el uso de los datos y de los recursos
de información disponibles (Rodríguez, 2002).
El objetivo central de la gestión de información en torno a cualquier problemática es
generar conocimiento profundo y sistemático tanto de la situación como de todas aquellas
acciones para contribuir a su solución, de tal manera que permitan generar los análisis
correspondientes para apoyar la toma de decisiones en cuanto a futuras acciones así como
apoyo a la generación o modificación de políticas. En este sentido, la información se
convierte en la memoria de la problemática (Presidencia de la república, 2010).
Los actores principales en la gestión de información son los miembros de las
organizaciones tanto proveedores como usuarios al mismo tiempo, esto debido a la
facilidad en el uso de herramientas para la captura, el procesamiento y análisis de
información (García, 2010).
Los procesos principales de la gestión de información son: la identificación de las
necesidades de información; la definición de la disponibilidad y accesos a las fuentes
informativas, su organización y almacenamiento; el análisis y monitoreo continuo a través
de diferentes modelos; el desarrollo de productos y servicios, su distribución y uso
compartido, base de la creación del conocimiento estructurado para la organización y, por
tanto, fundamento de la gestión del conocimiento (Moreira, Méndez y Rodríguez, 1999).
En la gestión de la información, como en todo proceso, es necesario realizar un estudio
previo de las necesidades de información, lo cual permitirá determinar con exactitud qué
información se necesita para apoyar las decisiones, lograr la estandarización de los
conceptos y el escalonamiento del ciclo de gestión de información, este último será la
herramienta para poder estructurar el éxito de la misma, un ciclo permite obtener
información sobre los resultados obtenidos, e introducir modificaciones a lo largo de su
aplicación(Presidencia de la república, 2010).
16
La información y el conocimiento son parte de un mismo proceso complejo vinculado
por conceptos como aprendizaje, inteligencia y tecnologías. Los flujos de información y
la generación de nuevos conocimientos dependen de modelos de comportamientos
informacionales y cognitivos de las personas. Buscar, almacenar, procesar, analizar,
representar, compartir y distribuir información y conocimiento debe ser una labor
relacionada con la motivación y el estímulo de los usuarios y por ende, con la creación de
competencias y habilidades que se han de impulsar de manera sistemática (Presidencia
de la república, 2010).
En La figura 1, Se ilustran las diferentes fases del ciclo de la gestión de información, en
la cual se detallan las etapas de planificación de información, recolección de datos
(fuentes, métodos y pruebas), validación de datos, análisis de datos y reporte final de la
información.
Ilustración 1. Ciclo de Gestión de la Información (Dalkir, 2011).
Al organizar y coordinar las actividades de gestión de la información en su ciclo, es
preciso tomar en consideración las políticas y el horizonte del que hacer, por cuanto es
importante definir las fuentes, los métodos para la recopilación de datos, la
sistematización y uso de la herramienta tecnológica y ello surtir un proceso de aprobación.
Los datos que no se utilizan ni difunden no son útiles. La pertinencia, la actualidad y la
precisión son los tres principios que deben orientar la utilización y recopilación de la
información (Presidencia de la república, 2010).
17
Este proceso se características por los siguientes atributos: La información se puede
almacenar y transferir, La información es de naturaleza intelectual e inmaterial, La
información caduca, La información puede ser compartida sin disminuir su utilidad para
ninguna de las personas que la utilizan, La información se enriquece con el intercambio
de ideas entre sus usuarios y La información no exige un uso excluyente
Es así, como la gestión de la información es el proceso que recolecta datos desde una
serie de fuentes definidas, y se encarga del correcto almacenamiento de los mismos
buscando la persistencia y la generación de conocimiento, la correcta implementación de
este proceso representa una ventaja competitiva para las empresas ya que de esta forma
se realiza una completa administración de la información la cual se convierte en clave de
desarrollo dentro del actual mercado en el cual la evolución tecnológica y las herramientas
generadas crean grandes volúmenes de información de diferente tipo diariamente.
2.3.1 Herramientas para la Gestión de la Información En la tabla 10, se describe una serie de herramientas tecnológicas que surgen a partir de
la evoluciones de las TIC’S y que permiten la adecuada gestión de la información
mejorándole a las personas y organizaciones el acceso a los datos.
Tabla 10. Herramientas de Gestión de la Información (Elaboración propia)
Herramienta Descripción Fuente
Experiencia Contextual y Social del
Usuario
Esta tendencia permitirá hacer acopio de información sobre los usuarios, su perfil y su entorno de forma tal que las interacciones sean más personalizadas y se aprovechen mejor las oportunidades de relacionamiento. Existen ya dispositivos que generan información sobre oportunidades de consumo para los usuarios, y sistemas que extraen información para proveer mejores servicios y soluciones a los consumidores.
(High, 2013)
Internet de las Cosas
Cada vez más, nos enteramos de dispositivos y aplicaciones en la red que permiten operar aparatos y sistemas, por ejemplo, artículos domésticos conectados en forma remota, generando así beneficios de diversa índole como seguridad, comodidad, ahorro, etc.
(High, 2013)
18
Esta tendencia se va acelerar en la medida que se conecten más “cosas”
Tiendas de Apps y Mercados
Las tiendas de apps están evolucionando y con ello creando nuevos mercados. Se estima que para el 2015 tendremos setenta mil millones de apps que se van a bajar en estas tiendas. Las aplicaciones personales van a empezar a migrar hacia aplicaciones de negocios, todo esto sobre la nube, con lo cual los usuarios pagarán sólo lo que consumen
(High, 2013)
Analytics de Siguiente Generación
Los modelos analíticos van a cambiar la forma en que utilizamos la información. En la actualidad la información sólo describe lo que ya ocurrió, es decir, es histórica y por lo tanto reactiva. La evolución en los analytics genera una nueva inteligencia a partir de los datos de diferentes fuentes que nos permitirán anticipar los modelos de conducta a partir de distintos perfilamiento, mediante sistemas que “aprenden” y se ajustan por si mismos a partir de la nueva información y sucesos que se registran
(High, 2013)
Big Data
Las TIC es una industria que siempre crece incluso ante escenarios de secesión, ya que la población siempre aumenta, a la par de las necesidades de conectividad y acceso a aplicaciones de toda índole, tanto de orden personal como empresarial. Big Data tiene que ver con la gestión de enormes y crecientes volúmenes de información que ya no puede ser almacenada en un solo Warehouse de datos, sino en modelo distribuido de distintas unidades interconectadas en función de la naturaleza de la información
(High, 2013)
Computación en Memoria
La gran ventaja de la computación en memoria es lograr mayor rapidez, ya que reduce la latencia a mínimos y se pueden hacer procesos dentro de la misma memoria e incluso los procesadores serán más rápidos y eficientes en el consumo de energía
(High, 2013)
Ahorradores de Energía Extrema
El consumo de energía es una de las grandes prioridades en los Centros de Contacto, debido a los costos que genera. Los teléfonos celulares han generado la producción de procesadores de baja energía. De hecho, Gartner estima que cada vez habrá más de este tipo de procesadores. Con esta solución,
(High, 2013)
19
los Centros de Datos serán mucho más eficientes, con servidores de mayor energía que tengan treinta o más procesadores)
Computación en la Nube
La gran tendencia es que las empresas migren hacia modelos en los que ya no sean dueñas de la infraestructura y servicios de TI, sino que las renten como servicio
(High, 2013)
2.4 Inteligencia de Negocios (BI) La Inteligencia de Negocios (en inglés BI, Business Intelligence) son las actividades que
realiza una empresa para hacer un uso eficiente de los datos recopilados, convertirlo en
información y obtener el conocimiento necesario para una correcta toma de decisiones
(Vanegas y Guerra, 2009). En la tabla 11, se describen otras definiciones relacionadas
con la Inteligencia de Negocios.
Tabla 11. Definiciones de Inteligencia de Negocios (Elaboración propia)
Definición Autor
Business Intelligence se refiere directamente a la práctica y al conjunto de herramientas que pueden ayudar a las empresas a adquirir un mejor entendimiento de ellas mismas. Esto gracias a la capacidad de explotar su información de una manera más sencilla y entender el porqué de nuestro desempeño o, mejor aún, plantear escenarios a futuro, lo cual nos ayudará a tomar mejores decisiones
(Flores, 2010)
Business Intelligence es un mercado que tiene como objetivo facilitar el acceso y análisis de la información corporativa y proporcionar las herramientas tecnológicas adecuadas para la toma de decisiones
(Urquizo, 2008)
La Inteligencia de Negocios es un concepto que hace referencia a las técnicas de análisis de datos destinados a encontrar información útil para la toma de decisiones, incluido el conjunto del software que aporta las interfaces y funciones necesaria que apoyan dicho proceso
(Ramírez, 2008)
Business Intelligence una arquitectura y colección de herramientas que buscan mejorar a las organizaciones, proporcionando vistas de aspectos de negocio a todos los empleados (estratégico, táctico, operacional) para que tomen mejores y más relevantes decisiones en menos tiempo y con la mayor información posible
(Torres, 2008)
Business Intelligence incluye las aplicaciones, infraestructura, herramientas y las mejores prácticas que permitan el acceso y el análisis de la información para mejorar y optimizar las decisiones y
(Gartner, 2013)
20
El término Inteligencia de Negocio aparece a mediados de los años 90´s y ha tomado
relevancia en los últimos tiempos ya que permite a las empresas analizar una gran
cantidad de información de manera rápida y procesarla con reglas o criterios del negocio
en forma inteligente y que facilitan la toma de decisiones. Debido a la gran cantidad de
información que se genera hoy en día en las empresas la inteligencia de negocios integra
la información y puede ser cruzada entre procesos evitando análisis aislados o
incompletos (Gonzales, 2008).
De acuerdo con Parr (2000), la inteligencia de negocios se define como la habilidad
corporativa para tomar decisiones. Esto se logra mediante el uso de metodologías,
aplicaciones y tecnologías que permiten reunir, depurar, transformar datos, y aplicar en
ellos técnicas analíticas de extracción de conocimiento, Por su parte Ballrd (2006),
considera que la BI permite generar conocimiento sobre los problemas y oportunidades
del negocio para que pueden ser corregidos y aprovechados respectivamente.
En la actualidad, las organizaciones toman sus decisiones basándose cada vez más en
información y menos en el instinto de sus gerentes. La habilidad de una empresa para
rendimiento
BI proporciona una manera rápida y efectiva de recopilar, abstraer, presentar, formatear y distribuir la información de sus fuentes de datos corporativos, permitiendo a los profesionales de la empresa, tanto dentro como fuera de la organización, visualizar y analizar datos precisos sobre las actividades fundamentales del negocio y utilizarlos para mejorarla toma de decisiones y la planificación estratégica
(Rosado, 2010)
Es un conjunto de modelos matemáticos y metodologías de análisis que aprovechan los datos disponibles para generar información y conocimientos útiles para los complejos procesos de decisión
(Vercellis, 2009)
BI es un conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información no estructurada (interna y externa a la compañía) en información estructurada, para su explotación directa o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio
(Negash, 2004)
Business Intelligence se compone de todas las actividades relacionadas a la organización y entrega d información así como el análisis del negocio.
(Hackney, 2001)
21
tomar buenas decisiones está directamente relacionada con su capacidad para transformar
ágilmente sus datos en información de calidad y ésta en conocimiento. Se hace necesario,
impulsar procesos que permitan aprovechar al máximo la información disponible,
buscando ofrecer mecanismos ágiles para la toma de decisiones con el fin de lograr un
mejor desempeño organizacional (Universidad Pontificia Bolivariana, 2012).
Algunas de las ventajas de BI son las siguientes: Permite disponer de una herramienta de
información sobre la gestión del negocio, facilita información que permita priorizar
actividades basadas en la necesidad de cumplimiento de objetivos de corto, mediano y
largo plazo, proporciona una única versión de la realidad del negocio y reduce la
incertidumbre y la subjetividad en el proceso de toma de decisiones.
En la figura 2, se ilustran las fases que componen la inteligencia de negocios, desde la
obtención de los datos, pasando por el proceso para convertirlos en información,
posteriormente en conocimiento y finalmente llegar a la toma de decisiones.
Ilustración 2. Fases de la Inteligencia de Negocios (Plugia, 2010)
El concepto de BI incluye una amplia categoría de metodologías, aplicaciones y
tecnologías que permiten concentrar, acceder, transformar y consultar datos,
transacciones e información no estructurada de la empresa (interna y externa) con el
objetivo de ayudar a tomar decisiones. Esto se puede lograr realizando la explotación
directa de la información (consulta) o llevando a cabo un análisis de la misma,
convirtiéndola en conocimiento (Barcelona Treball, 2012).
22
Además, BI también puede intervenir en diferentes procesos de las empresas, facilitando
el correcto desarrollo de las tareas de los diferentes trabajadores, generando nuevas
actividades y nuevas habilidades, mejorando la comunicación entre diferentes
departamentos o incrementando la capacidad de reacción de la empresa (Barcelona
Treball, 2012).
La aparición e integración de los sistemas de BI tiene repercusiones directas en las
oportunidades de negocio y de empleo en el sector de las telecomunicaciones y TIC’S.
Pero también afecta transversalmente el resto de sectores, que son quienes adquieren estos
sistemas para mejorar la gestión de su negocio (Barcelona Treball, 2012).Sea una
organización pequeña, mediana o grande, siempre estará inundada de datos. Un sistema
de call center, inventarios, facturación, contabilidad, producción, legal, de cualquier
industria siempre será una buena fuente de información para entender el negocio (Cano,
2011).
Las estrategias de BI buscan proveer a la organización de un mecanismo de análisis que
le permita tomar mejores decisiones, una vez implementado un sistema basado en
inteligencia de negocios la empresa podrá contar con datos consolidados y un repositorio
único de donde extraer información consolidada lo cual generara beneficios como poder
de previsión, mejor visibilidad de hacia dónde debe ir al compañía y un mejor uso de los
recursos.
2.4.1 Aplicaciones de Business Intelligence
En la tabla 12, se describen algunos enfoques en los cuales se han empleado soluciones
de Business Intelligence.
Tabla 12. Aplicaciones Inteligencia de Negocios (Elaboración propia)
Sector Descripción Fuente
Salud
En el área de la salud, la ejecución de proyectos y el uso de herramientas de inteligencia de negocios proporciona a prestadores, administradores y pacientes múltiples beneficios como: Aumenta la seguridad del paciente al permitir una rápida
(Pomares, 2013).
23
traducción de los descubrimientos científicos a la práctica clínica, Aumento en la rentabilidad de tratamientos gracias al análisis automatizado de evidencias que permite identificar los puntos críticos, Los profesionales de la salud pueden utilizar bases de datos externas (por ejemplo, los datos de investigaciones clínicas) para apoyar y orientar las decisiones internas, Aumenta la efectividad operativa y financiera al disponer de modelos predictivos y descriptivos que permitan analizar diferentes escenarios futuros y Aumentan los procesos colaborativos gracias a la disponibilidad de información para apoyar la toma de decisiones
Educativo
Business Intelligence (BI) ayuda a las instituciones educativas en el Control y reducción de gastos (seguimiento presupuestario, analítica), Mayor rentabilidad, Mayor competitividad y posicionamiento (gestión y retención del talento), Mejor gestión educativa (evaluaciones, seguimiento alumnos, profesores, calidad de la enseñanza, comparativas y benchmarking), Mayor capacidad de reacción ante cambios (escenarios de simulación para regulaciones, subvenciones, becas), Medición del impacto en el mercado (integración datos externos, seguimiento de campañas) y Mayor eficiencia (visión global, modelos causa-efecto, Balanced Scorecard).
(Edisa, 2009)
Inmobiliario
Una solución enfocada a la alta dirección, que permiten medir la estrategia mediante la consecución de objetivos, empleando indicadores y relaciones entre estos. Paralelamente, facilitan el seguimiento de acciones estratégicas y responsabilidades sobre el cumplimiento de objetivos empresariales y puesta en producción de acciones correctoras.
(López, 2013)
Asegurador
El éxito de las compañías aseguradoras depende en gran medida de la capacidad de predecir las reclamaciones o las posibles pérdidas en base a información basada en la experiencia. El Business Intelligence tiene un papel esencial para estas empresas, al ayudar a la mejora de la gestión de esa información, esencial para definir las políticas de precio o de cobertura de clientes y para ofrecer un
(García, 2010)
24
mejor servicio adaptado a las necesidades de sus clientes.
Transporte
Business Intelligence en el sector de transporte y logística tiene aportes en el control y reducción de gastos (seguimiento presupuestario, contabilidad analítica), mayor rentabilidad, mayor competitividad y posicionamiento (oferta más atractiva, gestión y retención del talento), mejor gestión logística (stocks, productividad, integración vertical, rutas, comparativas), mayor capacidad de reacción ante cambios (escenarios de simulación para cambios en el entorno: precios, regulaciones, variación de demanda) y mayor eficiencia (visión global, modelos causa-efecto, Balanced Scorecard)
(Edisa, 2009)
Bancario
En un entorno en el que imperan condiciones económicas inciertas, cambios demográficos y una severa crisis de confianza en los mercados, el enfoque en el cliente y la gestión de riesgo son los principales factores que impulsan la rentabilidad y la participación del sector bancario. La necesidad de disponer de información para gestionar estas prioridades obliga a los bancos a integrar la información, así como implementar iniciativas de gestión y almacenamiento de datos. Ante este panorama, un proyecto de Business Intelligence (BI) puede ofrecer a los usuarios del sector bancario la visibilidad y capacidad analítica de forma rápida y rentable, lo cual facilitaría la toma de decisiones.
(Saldaña, 2011)
2.5 Big Data Big Data está asociado a conjuntos de datos que crecen rápidamente y que por su cantidad
se dificulta su almacenamiento, procesamiento, análisis y gestión (Mejía, 2013).En la
tabla 13, se describen otras definiciones relacionadas con Big Data.
Tabla 13. Definiciones de Big Data (Elaboración propia)
Definición Autor
Tendencia tecnológica que busca aprovechar y darle valor a la información
(Medina, 2013)
25
Representa la necesidad de procesar rápidamente grandes cantidades de datos con una nueva hornada de soluciones tecnológicas que no son necesariamente la base de datos
(Lawson,2010)
Las tecnologías y prácticas emergentes que permiten recopilar, procesar, detectar y almacenar grandes volúmenes de datos estructurados y desestructurados de forma rápida y rentable
(Lawson, 2010)
Volumen masivo de datos, tanto estructurados como no-estructurados, los cuales son demasiado grandes y difíciles de procesar con las bases de datos y el software tradicionales
(ONU, 2012)
Big Data se refiere a la cantidad cada vez mayor de información que las organizaciones almacenan, procesan y el analizan, debido al creciente número de fuentes de información utilizadas.
(Tankard, 2012)
Término inglés que designa los conjuntos de datos de gran tamaño y generalmente desestructurados que resultan difíciles de manejar usando las aplicaciones de bases de datos convencionales
(Fidelity Worldwide Investment, 2013)
Término para una colección de conjuntos de datos tan grande y complejo que se hace difícil de procesar utilizando herramientas de gestión de base de datos a mano o datos tradicionales aplicaciones de procesamiento
(Innovation Edge, 2013)
Término que se emplea hoy en día para describir el conjunto de procesos, tecnologías y modelos de negocio que están basados en datos y en capturar el valor que los propios datos encierran
(Innovation Edge, 2013)
El mundo ha evolucionado de una sociedad basada en las transacciones, a una basada en
las interacciones a medida que se interactúa más a través de correos electrónicos,
mensajes enviados desde dispositivos móviles (SMS), redes sociales y la Web. Esto ha
creado una explosión de datos en volumen y tipo que no se hubiera podido imaginar hace
algunos años (Posada, 2014).
Por lo mencionado anteriormente nacen tendencias de bases de datos como lo es Big Data,
esta se enfocan en el análisis de grandes cantidades de información para la predicción de
comportamientos. A partir de esta tendencia surge la analítica de datos, la cual se ha
26
utilizado en el pasado tanto para descodificar los mensajes alemanes durante la Segunda
Guerra Mundial, para automatizar la defensa antiaérea apuntando contra aviones
enemigos, como para revolucionar el deporte profesional. La analítica predictiva ha
transformado y está cambiando cada día la vida moderna. El análisis de grandes
cantidades de datos ha revolucionado la investigación y el desarrollo, desde la estrategia
a seguir por empresas de cualquier tamaño o la forma en la que los consumidores toman
decisiones personales (Selta, 2013).
Las soluciones analíticas de Big Data están revolucionando la forma en que los
individuos, negocios, y gobiernos recolectan, almacenan y analizan los datos. Motivados
por la explosión en el volumen, variedad y velocidad de los datos disponibles, las
soluciones analíticas de Big Data están respondiendo a nuevas preguntas así como
ofreciendo respuestas más completas y precisas a preguntas que existían hace décadas.
En la tabla 14, se detallan las variables características de Big Data.
Tabla 14. Características de Big Data (Elaboración propia)
Característica Definición Autor
Volumen El volumen de los datos almacenados en los depósitos de las empresas ha pasado de ocupar megabytes y gigabytes a “petabytes”.
(Edge, 2013)
Variedad
La variedad de datos ha explotado, pasando de ser datos almacenados y estructurados, guardados en bancos de datos empresariales, a ser desestructurados, audio, video, XML, etc. Datos en streaming, cotizaciones bursátiles, medios sociales, máquina a máquina, datos de sensores… una creciente variedad de datos necesitan ser procesados y convertidos en información.
(Edge, 2013)
Velocidad La velocidad del movimiento, proceso y captura de datos dentro y fuera de la empresa ha aumentado significativamente.
(Edge, 2013)
Debido a las nuevas herramientas informáticas que en la actualidad se encuentran
posesionadas en el mercado, la información abunda y las empresas están buscando la
mejor forma de aprovecharla. Las empresas tienen acceso a más información que antes,
la cual proviene de muchas más fuentes y la obtienen casi al momento en que se genera.
27
El concepto de Big Data a menudo se relaciona con las empresas que ya operan en el
mundo de la información, como Google, Facebook, y Amazon. Pero compañías en
múltiples industrias están colocando los datos en el corazón de sus operaciones. Están
recolectando grandes cantidades de información, a menudo combinando indicadores
tradicionales como las ventas, con comentarios de redes sociales e información de
ubicación que viene de los dispositivos móviles. (Aguilar, 2012)
Desde años atrás las empresas han utilizados la analítica de negocios para obtener
conocimiento. En la actualidad con la incursión de nuevas soluciones tecnológicas los
datos han aumentado exponencialmente y es por esto que el día de hoy el procesamiento
y análisis de información ha tomado mayor fuerza y se ha convertido casi en un proceso
obligatorio para las empresas. En la tabla 15, se describen hitos donde en el pasado se ha
utilizado la analítica de negocios y donde se prevé que se utilizara en el futuro.
Tabla 15. Hitos Analítica de Negocios (Elaboración propia)
Periodo de Tiempo Hito Autor
1930 - 1949
Se realizan trabajos para descodificar los mensajes alemanes en la segunda guerra mundial.
(Fico, 2013) Se automatiza la defensa antiaérea apuntando contra aviones enemigos.
Se realizan simulaciones por ordenador para predecir el comportamiento de una reacción nuclear en cadena.
1950 - 1969
Se genera el primer modelo de predicción meteorológica.
(Fico, 2013) La analítica resuelve el “problema del camino más corto” mejorando el transporte aéreo y la logística,
1970 - 1999
Se crea el modelo para predecir el precio óptimo de las acciones en el futuro.
(Edge, 2013) Se comercializa la primera herramienta para apoyar a las decisiones guiadas por modelo.
Lanzamiento de Amazon y eBay. Inicia personalización de la experiencia online.
28
Se aplican algoritmos a las búsquedas web para maximizar la relevancia de los resultados.
2000 – Actualidad
Uso generalizado de la analítica. Recomendaciones de compra, gestión del tráfico, entre otros…
(Edge, 2013)
Proceso del lenguaje natural. Trabajo con datos no estructurados. Ejemplo mensajes de facebook, páginas web, PDFs e emails.
Llega de Big Data. Cada día se generan 2.5 trillones de bytes de datos.
Se hace viable la computación distribuida y el análisis de Big Data para la mayoría de las organizaciones.
Futuro
Intercambio de analítica en la nube. Aumento de la economía colaborativa.
(Edge, 2013) Las campañas de marketing desaparecen ya que la interacción con los consumidores es personal.
Sintetizando lo anterior, Big Data es la tendencia de base de datos que permite el
procesamiento de altos volúmenes de información obtenida de una serie de fuentes cuyos
datos no son estructurados, para las empresas esta tendencia de convierte en clave de su
propio desarrollo y vigencia en el mercado ya que ahora la tecnología se mueve por un
sinnúmero de aplicaciones que trabajan bajo imágenes, sonidos, videos y demás los cuales
están en aumento diariamente y las empresas deben poseer conocimientos y herramientas
parar soportar dichas aplicaciones y responder a las necesidades actuales de la sociedad.
En la tabla 16, se describen ejemplos reales de cómo diariamente se están generando
grandes cantidades de datos desde diferentes fuentes de información.
Tabla 16. Ejemplos de Aplicaciones de Big Data (Elaboración propia)
Ejemplo Autor
Los sistemas de RFID (Identificación por Radiofrecuencia) generan hasta 1.000 veces más datos que los sistemas convencionales de códigos de barras
(Edge, 2013)
29
Facebook tiene más de 901 millones de usuarios activos generando datos de interacción social
(Edge, 2013)
Más de 5.000 millones de personas telefonean, mandan mensajes de texto, tuitean y navegan por internet con teléfonos móviles
(Edge, 2013)
Cada día se envían 340 millones de tuits. Son aproximadamente 4.000 por segundo
(Edge, 2013)
Al día se generan 2.5 trillones de bytes de datos. El 90% de los datos que hay hoy en día en el mundo se han creado tan solo en los últimos dos años
(Edge, 2013)
En el mundo se registran cada segundo 10.000 transacciones de pagos con tarjetas
(Edge, 2013)
2.5.1 Aplicaciones de Big Data
En la tabla 17, se describen enfoques en los cuales se han empleado Big Data.
Tabla 17. Aplicaciones de Big Data (Elaboración propia)
Sector Descripción Fuente
Salud
La tendencia a manipular ingentes cantidades de datos se debe a la necesidad en muchos casos de incluir los datos relacionados del análisis en un gran conjunto de datos relacionado, tal es el ejemplo de los análisis de negocio, los datos de enfermedades infecciosas, o la lucha contra el crimen organizado. En el campo de la Salud, cuando se habla de Big Data se habla principalmente del potencial de procesamiento de datos digitalizados en los servicios sanitarios, que en muchos casos lindan con el Business Intelligence en Salud
(Osorio, 2013)
Comercial
Sus ventajas para el negocio en áreas como la gestión de las relaciones con el cliente, el desarrollo de nuevos productos, la detección del fraude o la predicción del comportamiento de los consumidores permiten a las compañías obtener resultados financieros un 20% por encima de sus competidores, según estimaciones de Gartner
(Sánchez, 2013)
Financiero
Entre las aplicaciones prácticas que puede tener Big Data en el sector financiero estarían la mejora de las capacidades de venta cruzada de productos financieros o no financieros, a partir de patrones de compra o de interés mostrados en determinados productos disponibles online; el
(Martín, 2012)
30
control de fraude, minimizando los riesgos de uso indebido de medios de pago cuando el titular se encuentra de viaje, por ejemplo; la mejora de los sistemas de “scoring” de crédito, incorporando elementos no tradicionales como las interacciones en redes sociales; y, por último, la fidelización y retención de clientes, ofreciéndoles promociones y ofertas comerciales adaptadas a sus necesidades y contexto.
Militar
De manera general, la aplicación de “Big Data” a defensa persigue capturar y utilizar grandes cantidades de datos para poder aunar sensores, percepción y decisión en sistemas autónomos.
(Ministerio de Defensa. 2012)
Industria Manufacturera
Las empresas manufactureras se esfuerzan por basar su producción en la demanda, para reaccionar más ágil y efectivamente a las cambiantes necesidades del mercado. Para lograrlo, requieren visibilidad y acceso a los datos provenientes tanto de la sección final del ciclo de la demanda como de la retroalimentación consignada por los clientes. Captura de enormes volúmenes de señales para la sección final del ciclo de la demanda (por ejemplo, los datos provenientes de los puntos de venta de las cadenas minoristas), así como de datos de investigaciones de mercado y encuestas sobre los sentimientos manifestados por los consumidores y Generación de valiosas percepciones en tiempo real, con el fin de ayudar a los encargados de las áreas de cadena de suministro, ventas y mercadeo a ser más reactivos y basar sus decisiones en las señales emitidas por las fuerzas de la demanda.
(Sala de Prensa Latinoamérica,
2013)
Informático
Big data se emplea en las consultas y resultados de los motores de búsqueda, los datos de las redes sociales (como los tuits), los datos meteorológicos, los datos astronómicos, la vigilancia militar, los datos económicos y bursátiles, los historiales médicos, los experimentos físicos (Gran Colisionador de Hadrones), los archivos fotográficos, la radio y la televisión, los vídeos (CCTV y YouTube) y los datos sobre transacciones
(Fidelity Worldwide Investment,
2013)
Otros Sectores
La capacidad de analizar eficazmente grandes cantidades de datos dio a la NASA ventaja durante la carrera espacial, sobre todo cuando construyó los cohetes Saturno V que llevaron al hombre a la luna. Durante la Guerra Fría, tanto EE.UU. como la Unión Soviética procesaban
(In Perspective, 2012)
31
grandes cantidades de datos de vigilancia militar durante las operaciones de información y durante décadas, las previsiones meteorológicas diarias han corrido a cargo de enormes superordenadores. Y las casas de apuestas y los casinos han desarrollado y mejorado continuamente sus modelos estadísticos para ir un paso por delante de los apostadores, mientras que los equipos deportivos (en el beisbol, en el ciclismo y cada vez más en el fútbol) utilizan analistas y estadísticos con la esperanza de conseguir una ventaja competitiva.
2.5.2 Modelos de Negocio Big Data
En la figura 3, se ilustran los principales planteamientos de modelos de negocio
(Diferenciación basada en la información, Intercambio basada en la información y Redes
de distribución basadas en la información) que han surgido a partir de Big Data.
Ilustración 3. Modelo de Negocio Big Data (Harvard Business Review, 2012)
Diversos sectores están utilizando Big Data para transformar los modelos de negocio y
mejorar el rendimiento en muchas áreas.
En la tabla18, se especifican diferentes campos de trabajo en los cuales se han
implementados modelos de negocios basados en Big Data.
32
Tabla 18. Modelos de Negocio Big Data (Elaboración propia)
Sector Áreas Fuente
Venta Minorista
Gestión de relaciones con el cliente
(Kearney, 2013)
Ubicación y distribución de tiendas
Detención y prevención de fraude
Optimizar la cadena de suministros
Precios dinámicos
Servicios Financieros
Trading algorítmico
(Kearney, 2013)
Análisis de riesgos
Detección de fraude
Análisis de carteras
Gobierno
Gobernanza del mercado
(Kearney, 2013)
Sistema de armas y contraterrorismo
Econometría
Informática aplicada a salud
Publicidad y Relaciones Publicas
Gestión de señales de demanda
(Kearney, 2013)
Publicidad personalizada
Análisis de sentimiento del mercado
Adquisición de clientes
Manufacturas
Investigación y productos
(Kearney, 2013)
Análisis de Ingeniería
Mantenimiento predictivo
Análisis de procesos y calidad
Optimización de la distribución
(Kearney, 2013) Medios y
Telecomunicaciones
Optimización de redes
Valoración de los clientes
Evitar pérdida de clientes
Prevención del fraude
Energía
Redes inteligentes
(Kearney, 2013)
Exploración
Modelos operacionales
Sensores de tendido eléctrico
33
Salud y Ciencias de la Vida
Farmacogenòmica
(Kearney, 2013)
Bioinformática
Investigación farmacéutica
Investigación de resultados clínicos
2.5.3 Metodologías Big Data Debido a los beneficios que representa para las empresas el poder utilizar y procesar todos
los datos con los que cuentan sin importar el formato de su información, existen
metodologías para el desarrollo de proyectos basados en Big Data establecidas y/o
propuestas por varias empresas. En la tabla 19, se especifican metodologías de trabajo
Big Data.
Tabla 19. Metodologías Big Data (Elaboración propia)
Metodología Etapas Actividades Fuente
ICAV
Identificar
Identificar claramente las necesidades del negocio
(Big Data, 2013)
Identificar usuarios finales
Conocer las preguntas que requieren responder para tomar mejores decisiones empresariales
Consolidar
Ubicar donde están las fuentes de información requeridas para responder las preguntas del negocio
Identificar que fuentes de información no estructuradas se requieren para hacer más rico el análisis
Consolidar información e repositorio común donde se acumulen las agregaciones y transformaciones necesarias para poder responder de la mejor manera las respuestas del negocio
Analizar Realizar el análisis de grandes volúmenes de información utilizando técnicas avanzadas de análisis predictivo y minería de datos
Visualizar
Diseminar esa información a los usuarios responsables para que puedan visualizar la información para la toma de decisiones empresariales
Definir la arquitectura del negocio)
34
Big Data Consulting
Methodology
Análisis de Negocio
Analizar los procesos del negocio
(Big Data, 2012)
Identificar clave de Big Data
Análisis de Datos
Definir la arquitectura de datos
Analizar el flujo de datos y el procesamiento
Definir la arquitectura técnica
Análisis Gap
Investigar las mejores prácticas para el tratamiento de grandes volúmenes de datos
Analizar brecha entre las mejores prácticas y la arquitectura de los datos heredados
Arquitectura de Datos
Definir arquitectura de datos
Definir arquitectura técnica para soportar la arquitectura de datos
Análisis del impacto
comercial
Definir las funciones de negocio afectadas por Big Data
Estimar el ROI (retorno de la inversión)
CBIG Framework
Estrategia
Identificar oportunidades
(CBIG, 2009)
Construir el caso de negocio
Determinar la gobernabilidad y la propiedad
Determinar solución de arquitectura
Hoja de ruta de Big Data
Arquitectura
Arquitectura • Datos • Procesos • Análisis • Visualización • Infraestructura y herramientas
Hoja de ruta de integración
Integración
Arquitectura
Infraestructura
Canales y Datos
Integración cloud
Mejores prácticas y metodologías
Realización
Mayor visibilidad
Previsibilidad
Visión estratégica
35
Crear valor
Metodología Compañía
Business Rio
Comprender la necesidad y panorama
actual
Priorización de las futuras capacidades de la arquitectura
(Business Rio)
Evaluar la disposición de datos
Desarrollar un proyecto
original de datos
Definir cuellos de botella
Identificar escenario
Identificar soluciones de alto nivel
Analizar riesgos y desafíos
Identificar arquitectura de
datos
Resaltar las capacidades arquitectónicas
Identificar las dependencias de tecnología, sistemas afectados
Perfeccionar los esquemas de almacenamiento de datos y los requisitos de mejora del inventario
Construir un plan del
proyecto de datos
Plan de lanzamiento basado en dependencias, prioridades y complejidades
Implementar solución de Big Data
Entregar fase de liberación
Evaluar los indicadores de desempeño
Medidas de control de procesos documentales
Las diferentes fases de la metodologia ICAV para la implementacion de proyectos de Big
Data se enfocan en lograr el exitoso termino de dichos proyectos, desde la identiificacion
de la necesidad hasta la visualizacion de resultados, pasando por un proceso de analsiis e
interpretacion de informacion.
En la figura 4, se ilustran las diferentes etapas empeladas dentro de la metodología ICAV.
36
Ilustración 4. Pasos Metodología ICAV (Big Data, 2013)
Big Data Consulting Methodology plantea una serie de etapas que abarcan todo el proceso
de creación de soluciones enfocándose en el análisis de diferentes áreas del negocio. En
la figura 5, se ilustran las diferentes etapas empeladas por Big Data Consulting
Methodology.
Ilustración 5. Big Data Consulting Methodology (Big Data Consulting, 2012)
CBIG Framework plantea una metodología diseñada para ayudar a las organizaciones que
desean aprovechar el poder de los grandes datos. En la figura 6, se ilustran las diferentes
etapas establecidas dentro de CBIG Framework para las soluciones de Big Data.
37
Ilustración 6. CBIG Framework (Big Data Consulting, 2012)
La metodología de trabajo planteada por la compañía Business Rio se enfoca en integrar
grandes volúmenes de datos en la hoja de ruta general de TI dentro de la empresa. En la
figura 7, se ilustran las diferentes etapas establecidas dentro de la Metodología de la
Compañía Business Rio.
Ilustración 7. Metodología de la Compañía Business Rio ((Business Rio))
2.5.4 Técnicas para el Análisis de Información Big Data Hay muchas técnicas que se basan en disciplinas como la estadística y la informática que
38
se pueden utilizar para analizar conjuntos de datos. A continuación se listan técnicas
aplicables en una amplia gama de industrias para el manejo de grandes volúmenes de
información (Ibermatica, 2011). En la tabla 20, se especifican las técnicas para el análisis
de información Big Data.
Tabla 20. Técnicas para el Análisis de Información Big Data (Elaboración propia)
Técnica Descripción Fuente
A / B Testing
Técnica en la que se compara un grupo de control con una variedad de grupos de prueba para determinar qué cambios mejoran una variable objetivo determinado. Esta técnica también se conoce como splittesting o buckettesting. Un ejemplo de aplicación es determinar qué textos, presentaciones, imágenes, colores mejorará los ratios convirtiendo una Web en un sitio de comercio electrónico. Big data permite a un gran número de pruebas para ser ejecutado y analizado, lo que garantiza que los grupos son de tamaño suficiente para detectar estadísticamente significativas diferencias entre el control y los grupos de tratamiento.
(Ibermatica, 2011)
Reglas de Asociación
Conjunto de técnicas para descubrir relaciones interesantes, es decir, “reglas de asociación,” entre las variables en las grandes bases de datos. Estas técnicas consisten en una serie de algoritmos para generar y poner a prueba las reglas posibles. Una de las aplicaciones es el análisis de la compra, en la que un vendedor puede determinar qué productos se compran conjuntamente con frecuencia y usar esta información para la comercialización (un ejemplo que se cita es el descubrimiento de que muchos compradores de supermercados que compran pañales también tienden a comprar cerveza).
(Ibermatica, 2011)
Clasificación
Un conjunto de técnicas para identificar las categorías a las que nuevos data points pertenecen, sobre la base de un entrenamiento conjunto que contiene los data points que ya han sido clasificadas. Una aplicación es la predicción de segmentos específicos de comportamiento de los clientes (por ejemplo, las decisiones de compra, tasa de rotación, tasa de consumo), donde hay una hipótesis clara o un resultado objetivo.
(Ibermatica, 2011)
Análisis de Cluster
Método estadístico para clasificar los objetos que se divide un grupo diverso en pequeños grupos de objetos similares, cuyas características de similitud no se conocen de antemano. Un ejemplo de análisis de cluster es la segmentación de los
(Ibermatica, 2011)
39
Técnica Descripción Fuente
consumidores en grupos de auto-similares para la comercialización directa. Este es un tipo de aprendizaje no supervisado, porque los datos de entrenamiento no se utilizan.
Fusión de Datos e Integración de Datos
Conjunto de técnicas para integrar y analizar datos de múltiples fuentes con el fin de desarrollar ideas en formas que sean más eficientes y potencialmente más precisas que si se han desarrollado mediante el análisis de una sola fuente de datos. Los datos de los medios de comunicación social, analizados por el procesamiento del lenguaje natural, se pueden combinar con datos en tiempo real las ventas, con el fin de determinar el efecto que una campaña de marketing está teniendo sobre la confianza del cliente y el comportamiento de compra.
(Ibermatica, 2011)
Minería de Datos
Un conjunto de técnicas para extraer patrones a partir de grandes conjuntos de datos mediante la combinación de los métodos de estadística y de aprendizaje de máquina con la gestión de bases de datos. Estas técnicas incluyen el aprendizaje de reglas de asociación, análisis de cluster, la clasificación y regresión. Las aplicaciones incluyen la minería de datos del cliente para determinar los segmentos más propensos a responder a una oferta, la minería de datos de recursos humanos para identificar las características de la mayoría de los empleados con éxito, o el análisis de cesta de la compra para modelar el comportamiento de compra de los clientes.
(Ibermatica, 2011)
Conjunto de Aprendizaje
El uso de varios modelos de predicción (cada uno desarrollado con estadísticas y / o aprendizaje de máquina) para obtener un mejor rendimiento de predicción. Este es un tipo de aprendizaje supervisado.
(Ibermatica, 2011)
Modelos de Predicción
Conjunto de técnicas en el que se crea un modelo matemático para predecir mejor las probabilidades de un resultado. La regresión es un ejemplo de las técnicas de modelado predictivo.
(Ibermatica, 2011)
Algoritmos Genéticos
Una técnica utilizada para la optimización que se inspira en el proceso de evolución natural o “supervivencia del más apto”. En esta técnica, las posibles soluciones se codifican como “cromosomas” que se pueden combinar y mutar. Estos cromosomas individuales se seleccionan para la supervivencia en un modelo “medio ambiente” que determina la idoneidad o el rendimiento de cada individuo de la población. A menudo descrito como una especie de “algoritmo
(Ibermatica, 2011)
40
Técnica Descripción Fuente
evolutivo”, estos algoritmos son muy adecuados para la solución de problemas no lineales. Ejemplos de aplicaciones incluyen mejorar la planificación de tareas en la fabricación y optimizar el rendimiento de una cartera de inversiones.
Procesamiento del Lenguaje Natural
(NLP)
Conjunto de técnicas de una subespecialidad de la informática (dentro de un campo históricamente llamada “inteligencia artificial”) y de la lingüística que utiliza algoritmos computacionales para analizar el lenguaje humano (natural). Muchas de las técnicas de PNL son los tipos de aprendizaje automático. Una de las aplicaciones de la PNL se utiliza el análisis de los sentimientos de los medios de comunicación social para determinar cómo los clientes potenciales están reaccionando a una campaña de marca.
(Ibermatica, 2011)
Redes Neuronales
Modelos computacionales, inspirados en la estructura y el funcionamiento de redes neuronales biológicas (es decir, las células y conexiones en el cerebro), para encontrar patrones en los datos. Las redes neuronales son muy adecuadas para la búsqueda de patrones no lineales. Pueden ser utilizados para el reconocimiento de patrones y su optimización.
(Ibermatica, 2011)
Análisis de Redes
Conjunto de técnicas utilizadas para caracterizar las relaciones entre los nodos discretos en un gráfico o una red. En el análisis de redes sociales, las conexiones entre los individuos en una comunidad u organización se analizan, por ejemplo, cómo viaja la información, o quién tiene más influencia sobre quién. Ejemplos de aplicaciones incluyen la identificación de líderes de opinión para orientar a la comercialización, y la identificación de cuellos de botella en los flujos de información de la empresa.
(Ibermatica, 2011)
Optimización
Técnicas numéricas utilizadas para rediseñar los sistemas y procesos complejos que mejoran su rendimiento de acuerdo a una o más medidas objetivas (por ejemplo, el costo, la velocidad o fiabilidad). Ejemplos de aplicaciones incluyen la mejora de los procesos operativos, como la programación, el enrutamiento y distribución en planta, y la toma de decisiones estratégicas, como la estrategia de la gama de productos, análisis de inversión vinculados, y de I + D estrategia de cartera. Los algoritmos genéticos son un ejemplo de optimización.
(Ibermatica, 2011)
Reconocimiento de Patrones
Conjunto de técnicas de aprendizaje automático para asignar algún tipo de valor de la producción
(Ibermatica, 2011)
41
Técnica Descripción Fuente
(o etiqueta) a un valor de entrada dado (o instancia) de acuerdo a un algoritmo específico. Las técnicas de clasificación son un ejemplo.
Regresión
Conjunto de técnicas estadísticas para determinar cómo el valor de la variable dependiente cuando una o más variables independientes se han modificado. A menudo se utiliza para el pronóstico o la predicción. Ejemplos de aplicaciones incluyen el volumen de ventas de predicción basado en el mercado y otras variables económicas o la determinación de los parámetros de fabricación.
(Ibermatica, 2011)
Análisis del Sentimiento
Aplicación de procesamiento de lenguaje natural y otras técnicas analíticas para identificar y extraer la información subjetiva de material de origen del texto. Los aspectos clave de estos análisis incluyen la identificación de la función, aspecto o producto sobre el cual se expresa un sentimiento, y determinar el tipo, la “polaridad” (es decir, positivo, negativo o neutro) y el grado y la fuerza del sentimiento. Ejemplos de aplicaciones incluyen las empresas que solicitan el análisis de los sentimientos de los medios de comunicación social (por ejemplo, blogs, micro blogs y redes sociales) para determinar cómo los diferentes segmentos de clientes y partes interesadas están reaccionando a sus productos y acciones.
(Ibermatica, 2011)
Análisis Espacial
Conjunto de técnicas, algunas aplicadas a la estadística, que analizan las propiedades topológicas, geométricas, o geográficos codificados en un conjunto de datos. A menudo, los datos para el análisis espacial provienen de los sistemas de información geográfica (GIS) en que la captura de datos incluye información sobre la ubicación, por ejemplo, direcciones o latitud / longitud. Ejemplos de aplicaciones incluyen la incorporación de los datos espaciales en regresiones espaciales (por ejemplo, cómo es la disposición del consumidor a comprar un producto relacionada con la ubicación).
(Ibermatica, 2011)
Visualización
Técnicas utilizadas para la creación de imágenes, diagramas o animaciones para comunicarse, entender y mejorar los resultados de los análisis de grandes volúmenes de datos.
(Ibermatica, 2011)
Estadísticas
Ciencia de la recopilación, organización e interpretación de datos, incluyendo el diseño de encuestas y experimentos. Las técnicas estadísticas se utilizan a menudo para hacer juicios sobre que las relaciones entre variables podrían haber ocurrido por casualidad (la “hipótesis nula”),
(Ibermatica, 2011)
42
Técnica Descripción Fuente
y que las relaciones entre las variables de resultado probable de algún tipo de relación causal subyacente (es decir, que son “estadísticamente significativos”). Las técnicas estadísticas se utilizan también para reducir la probabilidad de errores de tipo I (“falsos positivos”) y errores de tipo II (“falsos negativos”). Un ejemplo de una aplicación es las pruebas A / B para determinar qué tipo de material de marketing que la mayoría de aumentar los ingresos.
Aprendizaje Supervisado
Conjunto de técnicas de aprendizaje automático que infieren una función o relación de un conjunto de datos de entrenamiento. Los ejemplos incluyen la clasificación y el vector de apoyo machines.
(Ibermatica, 2011)
Simulación
Modelar el comportamiento de sistemas complejos, a menudo utilizado para el pronóstico, la predicción y planificación de escenarios. Simulaciones de Monte Carlo, por ejemplo, son una clase de algoritmos que se basan en un muestreo repetido al azar, es decir, miles de simulaciones, cada una basada en supuestos diferentes. El resultado es un histograma que proporciona una distribución de probabilidad de los resultados. Una aplicación es la evaluación de la probabilidad de alcanzar las metas financieras dadas las incertidumbres sobre el éxito de varias iniciativas.
(Ibermatica, 2011)
Análisis de Series
Conjunto de técnicas estadísticas y de procesamiento de señales para el análisis de secuencias de puntos de datos, que representan los valores en tiempos sucesivos, para extraer las características significativas de los datos. Ejemplos de análisis de series de tiempo incluye el valor por hora de un índice bursátil o el número de pacientes diagnosticados con una enfermedad determinada todos los días. Predicción de series es el uso de un modelo para predecir los valores futuros de una serie sobre la base de los valores anteriores o de otra índole. Algunas de estas técnicas, por ejemplo, el modelado estructural, estudio de la tendencia de una serie durante un tiempo, y los componentes residuales, que pueden ser útiles para la identificación de patrones cíclicos en los datos. Ejemplos de aplicaciones incluyen previsiones cifras de ventas, o la predicción del número de personas que serán diagnosticadas con una enfermedad infecciosa
(Ibermatica, 2011)
Aprendizaje no Supervisado
Conjunto de técnicas de aprendizaje automático que se encuentra escondida en la estructura de
(Ibermatica, 2011)
43
Técnica Descripción Fuente
datos sin etiquetar. El análisis de conglomerados es un ejemplo de aprendizaje no supervisado.
2.6 Seguridad de Información Big Data El auge de las redes sociales y otros servicios online, han convertido a Internet en una
gigantesca plataforma para la recolección de información, puesto que los usuarios van
registrando lo que les gusta y lo que no. Cada vez que una persona publica un comentario
en twitter o realiza una compra, se está generando informacion. Esta explosión de datos
es de tal envergadura que se necesitannuevas palabras para describirla, los gigabytes ya
no son suficientes, el volumen de los datos actualmente más grande y se mide en
petabytes, exabytes, zettabytes y yottabytes (Rodriguez, 2009).
En este contexto, las empresas necesitan especialmente dominar Big Data, aprovechar su
valor y al mismo tiempo hacer frente a los desafíos de seguridad que puedan plantearse.En
un proceso Big Data siempre es necesario destilar la información de valor a partir de los
datos en bruto que se reciben de la red. Es sobre la información procesada sobre la que se
debe aplicar especial atención desde el punto de vista de la seguridad (Rodriguez, 2009).
El primer desafío en el ámbito de la seguridad al que se enfrenta cualquier organización
que emprenda proyectos de Big Data es asegurar que sólo las personas adecuadas acceden
a determinadas categorías de información. Dentro de las empresas esto significa
establecer unos protocolos de acceso específicos para usuarios de negocio, otros para los
usuarios del área IT y separar claramente las tareas entre los usuarios de negocio y los
usuarios de tecnologia (Rodriguez, 2009).
44
Otro aspecto a tener en cuenta es qué tipo de medidas se van a establecer, mediante la
puesta en funcionamiento de herramientas de seguridad avanzada para evitar las fugas de
información. No hay que olvidar que los proyectos Big Data, que recopilan tanto
información estructurada como información no estructurada, son susceptibles de
acumular una gran cantidad de información de carácter sensible ya que en su mayoria los
datos provienen de redes sociales. Aunque dicha información haya sido cedida
voluntariamente por los usuarios, es imprescindible contar con mecanismos que aseguren
su confidencialidad e integridad, mediante sistemas de control de acceso y cifrado
(Rodriguez, 2009).
Por último, una adecuada política de seguridad en proyectos Big Data debe asegurar la
disponibilidad de la información y establecer unos niveles de protección proporcionados
a los riesgos y consecuencias de una posible pérdida. Así, la información más valiosa o
sensible debe estar protegida con mayores niveles de disponibilidad (Rodriguez, 2009).
Según Rodriguez, para garantizar la seguridad en una solución que se base en el
almacenamiento, procesamiento y análisis de información tipo Big Data, se deben
implementar las siguientes recomendaciones para afrontaren los proyectos de este tipo.
• Asegurar la computación en marcos de programación distribuidos.
• Implantar las mejores prácticas de seguridad en almacenamiento de datos no
relacionales.
• Asegurar el almacenamiento de datos y transacciones.
• Validación en el punto final (End-pointvalidation).
45
• Seguridad en tiempo real y compliance en la monitorización.
• Data mining y analítica escalable y con capacidad de preservar la privacidad de
los datos.
• Control de acceso y seguridad de la comunicación con sistemas encriptados.
• Control de acceso granular.
• Auditorías granulares.
• Gestión de la procedencia de los datos, en particular en los casos en los que es
importante registrar el historial digital de los mismos.
Un factor clave de las soluciones de analítica de negocios es garantizar las disponibilidad,
accesibilidad y protección de la información, ya que esta se convierte en la base para la
toma de decisiones a partir de su procesamiento y análisis, es aquí donde se encuentra el
conocimiento de las compañías y por esto se requiere de procesos bien definidos que
garanticen su seguridad.
2.7 Big Data Enfocada a la Inteligencia de Negocios Big Data está llevando sus capacidades hacia las manos de los directivos de nivel de línea,
que luego pueden utilizar datos no transaccionales para tomar decisiones empresariales
estratégicas a largo plazo, Big Data hará que la Inteligencia de Negocios sea más valiosa
y útil para el negocio (Ediciones Especiales Online, 2013).
Es importante analizar los procesos de toma de decisiones a partir del complemento que
puede representar Big Data ya que el exceso de información que se genera día a día,
ocasiona que las empresas comiencen a perder visibilidad sobre lo que ocurre en la
operación, y en ocasiones que la trazabilidad de la información se vuelve muy
complicada. A esto se suma que el tipo de contenido que se genera ya tiene varias formas
46
de presentarse, bien puede ser en texto, audio, imagen, video o una combinación de ellos
(Cervantes, 2014).
Combinando bases de datos relacionadas y no relacionadas, se pueden pronosticar
conductas y detectar patrones de comportamiento, como la influencia del clima, el
impacto de los materiales o colores usados en un producto y hasta predecir la demanda
para hacer presupuestos que determinarán el inventario y las negociaciones con
proveedores (Empresas Inteligentes, 2014).
A este fenómeno se le conoce como Big Data, y para el procesamiento de tanta
información existen procesos que se encargan de filtrar y tener como salida datos
relevantes y concisos según lo que se requiera. Business Intelligence (Inteligencia de
Negocios) se apoya de estas herramientas para obtener información importante para la
toma de decisiones en las organizaciones. La convergencia de las tecnologías de este tipo,
dan como resultado un alto valor a las empresas y organizaciones, al reducir los tiempos
en los que se realiza la toma de decisiones (Empresas Inteligentes, 2014).
Combinar Inteligencia de Negocios y Big Data permite un análisis potente de una gran
cantidad de datos que brinda una ventaja competitiva clave: la de transformar cualquier
tipo de datos (volumen, forma, ubicación) en informaciones de alto valor agregado para
cada sector de la empresa. Sin embargo, hay que saber explotar esta materia prima para
que se transforme en el mayor capital de una organización: el conocimiento pertinente
del negocio.
La alianza Inteligencia de Negocios y Big Data permite entre otras cosas, medir el sentir
de los consumidores, optimizar las cadenas de suministro y detectar el fraude (Sánchez,
2013). Es así como el proceso de toma de decisiones a partir de la información obtenida,
procesada y analizada a partir de la unión de estas tendencias de base de datos se puede
optimizar ya que es posible incluir mayores cantidades de datos desde diferentes fuentes
de información.
47
CAPITULO3. DIAGNOSTICO DEL ESTADO ACTUAL DE LA UNIDAD DE
ANÁLISIS EN EL CONTEXTO DE LA GESTION DE GRANDES VOLUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION DE ANALITICA DE
NEGOCIOS
De acuerdo a la metodología planteada en el numeral 1.5, a continuación se desarrolla la
segunda etapa planteada en el presente proyecto de investigación “diagnóstico del estado
actual de la unidad de análisis”, en la cual se analiza la situación en la cual se encuentra
MVM Ingeniería de Software S.A.S en el contexto de la gestión de grandes volúmenes
de información para la implementación de soluciones de analítica de negocios, con el fin
de identificar posibles falencias y/o dificultades a partir del marco conceptual elaborado
en el en el capítulo 2.
3.1 Instrumento de recolección de la información Para determinar el estado actual de la gestión de grandes volúmenes de información en el
contexto de las soluciones de analítica de negocios que desarrolla MVM Ingeniería de
Software S.A.S, se utilizó como instrumento de recolección de la información la encuesta;
Este instrumento es de gran importancia ya que permite conocer la opinión en relación
con los objetivos de la investigación de un grupo de personas seleccionadas y de acuerdo
con Trespalacios, Vázquez y Bello (2005), es utilizada en investigaciones de tipo
descriptiva, desde la cual se precisan identificar las preguntas a realizar, las personas
seleccionadas en una muestra representativa de la población, especificar las respuestas y
determinar el método empleado para recoger la información que se vaya obteniendo.
Dentro de la investigación se empleó la encuesta ya que por medio de esta técnica se logró
conocer de forma precisa la opinión de los expertos en gestión de información dentro de
la unidad de análisis, además de poder generar un estudio con cifras exactas para un
análisis preciso del estado actual de MVM Ingeniería de Software S.A.S en el contexto
de las soluciones de analítica de negocios. En la tabla 21, se detalla la ficha técnica de la
encuesta.
48
Tabla 21. Ficha Técnica Encuesta (Elaboración propia)
Ficha Técnica
Para acompañar cualquier publicación de los resultados, la siguiente ficha técnica debe ser incluida en su totalidad
Persona quien Realizo la Encuesta: Isabel Cristina Gómez Díaz Esneyder Ardila Cañas
Persona Encomendado y Financió: Isabel Cristina Gómez Díaz Esneyder Ardila Cañas
Grupo Objetivo: Colaboradores de MVM Ingeniería de Software S.A.S expertos en la gestión de información e inteligencia de negocios
Tamaño de la Muestra: 7 encuestas reales, 7 encuestas ponderadas.
Técnica de Recolección de Datos: Diligenciamiento de formulario desarrollado y publicado en Google drive
Tipo de la Muestra: La muestra es dirigida, los encuestados seleccionados son empleados de MVM Ingeniería de Software S.A.S
Preguntas que se Formularon: Ver Anexo A
Tema o Temas a los que se Refiere: Gestión de grandes volúmenes de información en el contexto de las soluciones de analítica de negocios
Fecha de Realización: Del 19 al 23 de Abril de 2014 Área / Cubrimiento: MVM Ingeniería de Software S.A.S Margen de Error Observado: 5.0% con 95% de confianza
En el anexos A, se ilustra la encuesta realizada a siete profesionales expertos de MVM
Ingeniería de Software S.A.S., en el contexto de gestión de información e inteligencia de
negocios, la encuesta tuvo como propósito realizar una investigación de tipo cualitativa,
donde se emplea el método de estudio de caso con el fin de plantear Estrategias para la
Gestión de Grandes Volúmenes de Datos por Medio de Big Data en el Contexto de la
Analítica de Negocios, el objetivo de este instrumento de recolección de información fue
conocer la opinión de expertos de MVM Ingeniería de Software S.A.S en el contexto de
la gestión de gestión de la información y analítica de negocios, con el fin de recibir sus
contribuciones en relación a la gestión de grandes volúmenes de información estructurada
y desestructurada para la implementación de soluciones y/o proyectos de Big Data. Esta
encuesta fue creada a través de la herramienta Google Docs. En el numeral 3.2, se
presenta el análisis de los resultados producto de la encuesta realizada.
3.2 Resultados de la encuesta A continuación se detalla el resultado obtenido por cada una de las preguntas generadas
en el instrumento de recolección de información (encuesta).
49
Figura 1. Resultado pregunta 1 de la encuesta (Google drive)
Figura 2. Resultado pregunta 2 de la encuesta (Google drive)
Figura 3. Resultado pregunta 3 de la encuesta (Google drive)
Figura 4. Resultado pregunta 4 de la encuesta (Google drive)
50
Figura 5. Resultado pregunta 5 de la encuesta (Google drive)
Figura 6. Resultado pregunta 6 de la encuesta (Google drive)
Figura 7. Resultado pregunta 7 de la encuesta (Google drive)
Figura 8. Resultado pregunta 8 de la encuesta (Google drive)
51
Figura9. Resultado pregunta9 de la encuesta (Google drive)
Figura10. Resultado pregunta10 de la encuesta (Google drive)
Figura 11. Resultado pregunta11 de la encuesta (Google drive)
Figura 12. Resultado pregunta 12 de la encuesta (Google drive)
52
Figura 13. Resultado pregunta 13 de la encuesta (Google drive)
Figura 14. Resultado pregunta 14 de la encuesta (Google drive)
Figura 15. Resultado pregunta 15 de la encuesta (Google drive)
Figura 16. Resultado pregunta 16 de la encuesta (Google drive)
53
Figura 17. Resultado pregunta 17 de la encuesta (Google drive)
Figura18. Resultado pregunta 18 de la encuesta (Google drive)
Figura 19. Resultado pregunta 19 de la encuesta (Google drive)
Figura20. Resultado pregunta20 de la encuesta (Google drive)
54
Figura 21. Resultado pregunta 21 de la encuesta (Google drive)
Figura 22. Resultado pregunta 22 de la encuesta (Google drive)
Figura 23. Resultado pregunta 23 de la encuesta (Google drive)
3.3 Análisis de resultados En la tabla 22, se describen los resultados porcentuales de cada una de las preguntas realizadas en la encuesta con sus respectivos análisis. Los cuales se ubican en las siguientes etapas planteadas a través de la metodología ICAV la cual se enfocan en el ciclo de vida de la gestión de la información en el contexto de la gestión de grandes volúmenes de información no estructurada, las etapas son: Identificar (planeación y análisis), consolidar (obtención, transformación, seguridad y almacenamiento de datos), analizar (procesamiento y análisis de datos) y visualizar (visualización de información).
56
Tabla 22. Análisis de los resultados (Elaboración propia)
Identificar (planeación y análisis) Interpretación De acuerdo a la opinión de los expertos encuestados, consideran con un 29% que el principal beneficio de las soluciones que actualmente desarrolla MVM Ingeniería de Software S.A.S en el contexto de la analítica de negocios, al ofrecer la implementación, procesamiento, análisis y manejo de grandes volúmenes de datos , tiene que ver con el conocimiento de las necesidades y preferencias de los clientes, lo cual facilitara tomar decisiones más acertadas en cuanto a la orientación de productos y/o servicios para satisfacer necesidades de los clientes de forma específica. El segundo beneficio con un 23%, tiene que ver con el Análisis de mayores volúmenes de información permitiendo tener en cuenta diversas fuentes de datos, lo cual facilitara tomar decisiones más acertadas referentes al negocio en general.
A partir del resultado obtenido en las preguntas relacionadas con la etapa planeación y análisis, y según los datos de las figuras 4, 11, 15, 16, 18, 19 y 23 del punto 3.2, se identifica que en MVM Ingeniería de Software S.A.S se reconoce la importancia y los beneficios que ofrece el manejo de grandes volúmenes de información para las aplicaciones de analítica de negocios que actualmente se desarrollan, ya que de esta forma se pueden conocer tendencias y necesidades de los usuarios para una mejor toma de decisiones. Por lo cual, para la organización es relevante incluir diversas fuentes de información para el análisis de datos. Otro aspecto importante, radica en que el manejo de grandes volúmenes de información representan ganancias económicas las cuales se ven reflejadas en aspectos como la reducción de costos y el incremento en ventas por tener la posibilidad de saber específicamente las necesidades de los usuarios . Se evidencia que la organización tiene etapas definidas
A partir de la opinión de los expertos encuestados, se considera con un 21% que la principal ganancia económica que tienen las empresas a través del conocimiento obtenido de los datos procesados y analizados en las soluciones las cuales utilicen grandes volúmenes de datos desestructurados es el incremento en las ventas ya que se dirigen los recursos de la empresa en ofrecer productos y/o servicios a usuarios específicos que requieran realmente el bien o servicio ofrecido. Los siguientes dos beneficios con un 18% cada uno es la reducciones en los costos de estudios de mercado ya que se podrán conocer las tendencias actuales del mercado y la optimización del proceso de inversión ya que se podrán conocer las tendencias del mercado y con esto realizar inversión en áreas puntuales de la empresa para responder a dichas tendencias. Según lo opinado por los expertos encuestados, en un 18% el costo invertido en talento humano y tecnología para la implementación de proyectos que involucren datos no estructurados se ve retornado para la empresa principalmente en la identificación de las necesidades específicas de los usuarios y la identificación de opciones de mejoramiento para los productos y/o servicios que ofrece la empresa. Y en un 15% en el conocimiento y visión actual que se puede tener de las tendencias del mercado. Conforme a la opinión de los expertos encuestados, se considera con un 16% para cada una, que las etapas que se tienen en cuesta dentro de MVM Ingeniería de Software S.A.S para el desarrollo de las soluciones de analítica de negocios las cuales utilizan grandes volúmenes de datos desestructurados para la toma de decisiones es la preparación e identificación de las preguntas de negocio, la obtención de datos, la preparación y transformación de los datos, el almacenamiento y el Procesamiento y análisis de información y con un 13% la etapa de visualización y generación de resultados. Respecto a la opinión de los expertos encuestados, se considera en un 25% que para las soluciones de analítica de negocio basadas en la gestión de grandes volúmenes de información desarrolladas por MVM Ingeniería de Software S.A.S el planteamiento de los requisitos de negocio se realizan a partir de la definición de requisitos funcionales y no funcionales, y en un 14% los otros aspectos tenidos en cuenta son la Diagramación de la solución implementar (diagramas de casos de uso, diagramas de estado, diagramas de secuencia, diagramas de objetos, diagrama de actividades), la Diagramación del modelo de datos inicial a implementar y la Identificación de la plataforma actual y sistemas de información con los que cuenta el cliente. A partir de la opinión de los expertos encuestados, se considera en un 16% que el aspecto de mayor importancia al momento de enfrentar una solución de analítica de negocios basada en el procesamiento de grandes cantidades de información estructurada y desestructurada es el Conocimiento de la necesidad del usuario, y en un 14% otros de los aspectos de importancia al momento de enfrentar una solución de analítica de negocios son el Conocimiento del negocio, la Variedad de fuentes de información y el Recurso humano con conocimiento y experiencia en el tema.
57
Según lo opinado por los expertos encuestados, se considera necesario en un 16% respectivamente que los procesos de análisis y procesamiento de grandes cantidades de información en las soluciones de analítica de negocios que se desarrollan en MVM Ingeniería de Software S.A.S deben ser mejorados incluyendo información no estructurada porque se puede tener en cuenta todas las fuentes que generan información administrativa, financiera, comercial y de mercado dentro de la empresa, además porque permite conocer las tendencias de mercado con las cuales tienen relación el usuario, permite conocer las necesidades actuales de los usuarios en cuanto a productos y/o servicios que ofrece la empresa, se podrán enfocar los servicios y/o productos generados por la empresa para determinados grupos de clientes según sus necesidades y se obtener un mejor conocimiento de los clientes y el mercado gracias a que se analizara toda la información disponible y que ha sido generada por ellos mismos.
para el desarrollo de aplicaciones de analítica de negocios y procesos claros para identificación de las necesidades y requisitos de los clientes, lo cual es una ventaja competitiva en las soluciones que se desarrollan.
Consolidar (obtención de datos) Interpretación
De acuerdo con los expertos encuestados, las soluciones implementadas o en etapa de desarrollo de MVM Ingeniería de Software S.A.S utilizan en un 29% grandes cantidades de datos no estructurados y en un 71% se utiliza información estructurada obtenida desde bases de datos relacionales.
A partir del resultado obtenido en las preguntas relacionadas con la etapa obtención de datos y según los datos de las figuras 1, 5, 6 y 10 del punto 3.2, se evidencia que en las soluciones que desarrolla MVM Ingeniería de Software S.A.S en el contexto de la analítica de se tiene un bajo porcentaje de utilización de datos no estructurados, debido a que las fuentes de información que se emplean para la captura y almacenamiento de información son bases de datos tradicionales y con archivos planos, aunque si se integra información de varias fuentes empresariales .
Según con los expertos encuestados, en un 28% se hace necesario incluir tipos de información de bases de datos relacionales para las soluciones de analítica de negocios que desarrolla actualmente MVM Ingeniería de Software S.A.S, y en un 24% archivos planos lo cual indica que estos tipos de soluciones trabajan principalmente con información estructurada.
A partir de la opinión de los expertos encuestados, en un 19% respectivamente la información empresarial que integran Las soluciones de analítica de negocios que son desarrolladas actualmente por parte de MVM Ingeniería de Software S.A.S es de sistemas comerciales, ERP (sistemas de planificación de recursos empresariales) y CRM (sistemas para la gestión de relaciones con el cliente), y en un 14% de los sistemas de facturación. Conforme a la opinión de los expertos encuestados, se considera en un 29% que el principal tipo de información que no se tiene en cuenta por su estructura o por las limitaciones propias de la herramienta de inteligencia de negocios en las soluciones de toma de decisiones desarrollados por MVM Ingeniería de Software S.A.S es Información contenida en archivos multimedia (imágenes, audio, video), y en un 25% respectivamente la Información contenida en foros y la Información expuesta en redes sociales tampoco es tenida en cuenta dentro de las soluciones de toma de decisiones.
Consolidar (preparación y transformación de datos) Interpretación
Dentro de MVM Ingeniería de Software S.A.S el 29% de los expertos encuestados consideran que los grandes volúmenes de datos que se encuentran en forma no estructurada si representan dificultad para el desarrollo de soluciones de analítica de negocios, y por el contrario el 71% restante considera que los datos no estructurados no generan dificultades para las soluciones de analítica de negocios.
A partir de los resultados obtenidos en las preguntas relacionadas con la etapa de transformación de datos y según los datos de las figuras 2, 8 y 12 del Conforme a la opinión de los expertos encuestados, un 25% considera que la principal limitación y/o dificultad que actualmente presentan
las soluciones enfocadas en analítica de negocios para la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S es la
58
limitación al seleccionar las fuentes de información de donde se obtendrán los datos a procesar, seguida en un 20% por limitación de la Información que no puede ser tenida en cuenta para ser procesada por su tipo y/o estructura.
punto 3.2, se evidencia que las soluciones desarrolladas por MVM Ingeniería de Software S.A.S en el contexto de la analítica de negocios actualmente se limitan por no incluir todas las fuentes de información disponibles debido a los datos no estructurados manejan.
Según con los expertos encuestados, en un 20% se considera que la mayor dificultad que presentan las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S, por no incluir tipos de datos desestructurados es la dificultad al tener que descartar determinadas fuentes de información por la estructura de los datos que manejan, seguida en un 15% respectivamente por otras dificultades como la dificultad al permitir solo conocimiento parcial y no general de la empresa (cliente objetivo), la dificultad al limitar el formato de los datos a procesar, la dificulta al identificar plenamente las necesidades de los clientes y la dificulta de la toma de decisiones sin conocimiento completo de la empresa y/o del mercado.
Consolidar (seguridad y almacenamiento de datos) Interpretación De acuerdo a la opinión de los expertos encuestados, en un 19% en las soluciones de analítica de negocio desarrolladas por MVM Ingeniería de Software S.A.S para la seguridad de los datos en el contexto de la gestión de grandes volúmenes de información el aspecto que más se tiene en cuenta es la integridad de la información y en un 16% respectivamente otros aspecto tenidos en cuenta para la seguridad de los datos son la protección de los niveles de accesibilidad de la información a partir de la creación y definición de perfiles y roles, las alternativas de recuperación de información y las opciones de respaldo y/o copias de seguridad de los datos.
A partir de los resultados obtenidos en las preguntas relacionadas con la etapa de seguridad y almacenamiento de datos y según los datos de las figuras 13, 14, 17, 20, 21 y 22 del punto 3.2, se evidencia que en MVM Ingeniería de Software existe una gran interés por la seguridad de la información, ya que se tienen plenamente identificadas técnicas y herramientas para el respaldo de los datos, al igual que se tiene claridad en cuanto a la arquitectura y estructura que requiere una solución de analítica de negocios enfocada en el manejo de grandes volúmenes de información. Pero el trabajo con bases de datos y
A partir de la opinión de los expertos encuestados, con un 27% respectivamente el almacenamiento en la nube (cloud computing) y los respaldos periódicos de información son las técnicas que se considera más eficientes para garantizar el respaldo y seguridad de la información de un proyecto de analítica de negocio que incluya información no estructurada, seguido en un 20% de los servidores de respaldo como técnica eficiente para el respaldo de información. Según lo opinado por los expertos encuestados, con un 24% respectivamente se considera que los aspectos más importantes al momento de plantear la arquitectura para la implementación de proyectos de analítica de negocios que involucren información de tipo Big Data es la escalabilidad y el rendimiento, y en un 19% la disponibilidad también se considera como un aspecto de importancia para la arquitectura de una aplicación que involucren información de tipo Big Data. Respecto a la opinión de los expertos encuestados, el aspecto físico considerado de mayor importancia con un 25% al momento de implementar una plataforma la cual soporte un sistema basado en analítica de negocios para el procesamiento de grandes volúmenes de información estructurada y desestructurada para la toma de decisiones son los servidores, seguido en un 18% respectivamente por las redes, los discos de almacenamiento y la memoria para el procesamiento. Conforme a la opinión de los expertos encuestados, en un 58% las bases de datos relacionales son el tipo de base de datos más utilizada en las soluciones de analítica de negocios desarrolladas dentro de MVM Ingeniería de Software S.A.S, seguida en un 17% por las bases de datos documentales, lo cual indica que no se utilizan bases de datos especializadas para el manejo de informacio9n no estructurada con lo cual se concluye que los datos de este tipo no tienen una gran implementación en las soluciones de analítica de negocios dentro de MVM Ingeniería de Software S.A.S.
59
Dentro de MVM Ingeniería de Software S.A.S para el desarrollo de soluciones de analítica de negocios, un 57% de los expertos encuestado expresa que para este tipo de soluciones no se emplean herramientas especializadas para el trabajo con grandes cantidades de información estructurada y no estructurada, solo en un 29% se utiliza Hadoop como herramienta para el manejo de datos no estructurados.
herramientas especializadas en la gestión de información no estructurada es mínima.
Analizar (procesamiento y análisis de datos) Interpretación
A partir de la opinión de los expertos encuestados, con un 17% respectivamente es dentro de soluciones basadas en analítica de negocios que permitan la posterior toma de decisiones el aspecto de mayor importancia al momento de analizar información de tipo Big Data es la variedad de datos, el volumen de datos y la diversidad de fuentes de Información seguido en un 13% por la Velocidad de Procesamiento de Información.
A partir del resultado obtenido en las preguntas relacionadas con la etapa de procesamiento de datos y según los datos de las figura 7 del punto 3.2, se identifica que para MVM Ingeniería de Software es importante contar con información obtenida desde diferentes fuentes de información en las soluciones de analítica de negocios que desarrolla, ya que la variedad de datos permite obtener mayor conocimiento a través del análisis de la información. A su vez, es importante resaltar que el procesamiento de la información no estructurada representa dificultad en el análisis de datos.
Visualizar (visualización de información) Interpretación
Dentro de MVM Ingeniería de Software S.A.S, se considera en un 86% que la implementación, procesamiento, análisis y manejo de grandes volúmenes de datos en el contexto de la analítica de negocios puede mejorar la toma de decisiones.
A partir del resultado obtenido en las preguntas relacionadas con la etapa de visualización de información y según los datos de las figuras 3 y 9 del punto 3.2, se evidencia que para MVM Ingeniería de Software la cantidad y variedad de datos analizados ofrece mayor conocimiento del negocio y por ende una visión más amplia del mercado lo cual mejora el proceso de toma de decisiones.
Conforme a la opinión de los expertos encuestados, con un 11% se considera que las soluciones enfocadas en la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S si se incorpora big data podrían fortalecer los resultados ofrecidos para una mejor toma de decisiones, seguido en un 9% respectivamente por el conocimiento de tendencias, comportamientos y necesidades en el contexto del mercado actual en el cual se enfoca la empresa, un mayor conocimiento de los tipos y segmentos de clientes , la precisión en la identificación de servicios y/o productos para satisfacer necesidades de los clientes de forma específica, la identificación de múltiples variables sobre el comportamiento y desempeño de la unidad de análisis en los proyectos (clientes, ventas, costos, gastos, indicadores) y la identificación de posibles opciones de crecimiento para el negocio al conocer globalmente la aceptación de los productos y/o servicios que ofrece al empresa como otras opciones resultantes del fortalecimiento de la soluciones enfocadas en la toma de decisiones si se incorpora Big Data.
60
A partir del análisis realizado a los resultados obtenidos de la aplicación de la encuesta al
personal experto en gestión de información e inteligencia de negocios de MVM Ingeniería
de Software S.A.S y el cual se detalló en la anterior tabla, a continuación de describen los
hallazgos identificados según el análisis realizado. En la tabla 23, se identifican los
principales hallazgos identificados a los resultados de la encuesta, por medio de una
matriz DOFA1.
Tabla 23. Hallazgos Identificados del Análisis a la Encuesta (Elaboración propia)
Etapa Debilidades Oportunidades Fortalezas Amenazas
Id
entif
icar
(p
lan
eaci
ón y
an
ális
is)
En el análisis y diseño para el desarrollo de las soluciones de analítica de negocios no se tiene en cuenta al información de tipo no estructurada
Si MVM Ingeniería de Software S.A.S incluye dentro de la etapa de planeación y análisis de sus soluciones la posibilidad de trabajar con tipos de datos no estructurados obtenidos desde diferentes fuentes de información, podrá satisfacer en mayor medida las necesidades de los clientes y ofrecer al mercado aplicación que integren mayores volúmenes de información y con esto optimizar los procesos de analítica de negocios ofreciendo un proceso de toma de decisiones más acertado.
Se reconoce la importancia de incluir diversas fuentes de información no estructurada en las soluciones de analítica de negocios. Se tienen etapas definidas para el desarrollo de las soluciones de analítica de negocios. Se cuenta con procesos definidos para la identificación de las necesidades y levantamiento de requisitos para el desarrollo de las soluciones de analítica de negocios. Se emplean métodos de diagramación y documentación para el diseño de las soluciones de analítica de negocios. Se reconoce la importancia del análisis de datos de tipo no estructurado para la toma de decisiones en el contexto de las soluciones de analítica de negocios.
Si MVM Ingeniería de Software S.A.S no incluye dentro de la etapa de planeación y análisis de sus soluciones la posibilidad de trabajar con tipos de datos no estructurados obtenidos desde diferentes fuentes de información estará limitando sus aplicaciones de analítica de negocios, ignorando información clave para el negocio lo cual se verá reflejado en procesos de toma de decisiones sin conocimiento pleno del mercado y de la situación actual de la empresa.
La matriz DOFA es un método que permite analizar tanto el entorno como el negocio y sus interacciones, es decir, permite trabajar con toda la
información que se puede conseguir, como herramienta permite trabajar con toda la información que posea sobre su negocio, útil para examinar sus
Debilidades internas, Oportunidades externas, Fortalezas internas y Amenazas externas (López, 2001).
61
Etapa Debilidades Oportunidades Fortalezas Amenazas
Se identifican y reutilizan recursos físicos existentes para la implementación de soluciones de analítica de negocios. Se tiene conocimiento de cómo enfrentar soluciones de analítica de negocios las cuales trabajen con datos no estructurados.
Co
nso
lidar
(o
bte
nci
ón
de
dat
os)
Se trabaja en un bajo porcentaje con tipos de datos no estructurados. Se descartan fuentes de información por la estructura de sus datos lo cual implica para las soluciones de analítica de negocios que desarrolla MVM Ingeniería de Software S.A.S trabajar con información limitada y ofrecer resultados parciales y no generales para la toma de decisiones.
Si MVM Ingeniería de Software S.A.S incluye diferentes fuentes de información de tipo no estructurado para el desarrollo de sus soluciones de analítica de negocios podrá procesar mayores volúmenes de información lo cual le dará un mayor conocimiento del mercado, las tendencias y comportamientos de sus clientes, generando así ventaja competitiva que le permitirá conocer las necesidades puntuales de dichos clientes.
En las soluciones de analítica de negocios se integran datos de diferentes fuentes de información empresarial lo cual permite luego del procesamiento y análisis de la información conocer el estado actual de todas las áreas de la empresa y como se pueden afectar entre sí, mejorando de esta forma el proceso de toma de decisiones.
Si MVM Ingeniería de Software S.A.S no incluye diferentes fuentes de información de tipo no estructurado para el desarrollo de sus soluciones de analítica de negocios limitara el procesamiento de información solo a unos cuantos tipos de datos lo cual al momento de analizar y tomar decisiones solo le ofrecerá conocimiento pleno del negocio y de mercado, viéndose de esta forma obligado hacer mayores estudios y análisis para conocer las necesidades puntuales de sus clientes.
Con
solid
ar (
pre
par
ació
n y
tran
sfo
rmac
ión
de
dat
os)
Los grandes volúmenes de datos que se encuentran en forma no estructurada representan dificultad para el desarrollo de soluciones de analítica de negocios.
Si MVM Ingeniería de Software S.A.S en sus procesos de transformación de datos, información de tipo no estructurada podrá desarrollar aplicaciones que soporten este tipo de datos lo cual se convierte en un aspecto clave para la
Se tiene conocimiento acerca de las herramientas, técnicas y aspectos físicos (hardware) necesarios para transformación de los datos de tipo no estructurado
Si MVM Ingeniería de Software S.A.S en sus procesos de transformación de datos no incluye información obtenida desde fuentes de datos no estructurada estará limitando sus soluciones de analítica de negocios
62
Etapa Debilidades Oportunidades Fortalezas Amenazas
El uso de herramientas especializadas para trabajo con datos de tipo no estructurado es mínimo, esto se debe a que los datos de tipo no estructurado no se incluyen en gran medida en las soluciones de analítica de negocios por lo cual no genera la necesidad de implementar soluciones propias para el manejo de estos datos.
optimización de los procesos de toma de decisiones
y perdiendo oportunidades de negocio en el mercado ya que no estaría actualizado con en cuento a las tendencias de bases de datos e de inteligencia de negocios que ofrece el mercado
Co
nso
lidar
(se
gu
rid
ad y
alm
acen
amie
nto
de
dat
os)
No se utilizan bases de datos especializadas para el manejo de grandes volúmenes de información no estructurada, esto se debe a que los datos de tipo no estructurado no se incluyen en gran medida en las soluciones de analítica de negocios por lo cual no genera la necesidad de trabajar con bases de datos propias para el manejo de este tipo de información, en la actualidad las bases de datos tradicionales soportan la necesidad de MVM Ingeniería de Software S.A.S por no trabajar con datos de tipo no estructurado.
Si MVM Ingeniería de Software S.A.S en sus procesos de almacenamiento incluye herramientas y técnicas especializadas en manejo de datos de tipo no estructurado podrá crear aplicaciones que soporten este tipo de información y las cuales se podrán integrar con las actuales soluciones que ofrece el mercado y que día a día se hacen más comunes para los usuarios como la redes sociales los foros, los blogs, entre otras.
Se conocen los aspectos de seguridad necesarios para la protección y/o recuperación de datos desestructurados, lo cual le permite a MVM Ingeniería de Software S.A.S ofrecer aplicaciones seguras y garantizar la protección de la información y la recuperación de forma ágil y optima sin generar mayores reprocesos a sus clientes. Se tiene claridad en cuanto a la arquitectura y estructura que requiere una solución de analítica de negocios enfocada en la gestión de grandes volúmenes de información.
Si MVM Ingeniería de Software S.A.S en sus procesos de almacenamiento de información no estructurada no incluye herramientas especializadas en el manejo de este tipo de datos, no podrá integrase con las aplicaciones actuales del mercado y tendrá que limitarse a los tipos de datos no estructurados lo cual genera una desventaja de negocio.
63
Etapa Debilidades Oportunidades Fortalezas Amenazas A
nal
izar
(p
roce
sam
ien
to y
aná
lisis
de
dat
os)
El procesamiento de la información no estructurada representa una dificultad para el análisis de datos en el contexto de las soluciones de analítica de negocios.
Si MVM Ingeniería de Software S.A.S en sus procesos de análisis de información incluye tipos de datos no estructurados morara los procesos de toma de decisiones que incluyan sus aplicaciones ay que estará teniendo en cuenta toda la información clave del negocio y así se podrán identificar falencias, fortalezas, necesidades y oportunidades.
Se reconoce la importancia de contar con información obtenida desde diferentes fuentes de información en las soluciones de analítica de negocios, lo cual permite a MVM Ingeniería de Software S.A.S en un futuro crear soluciones que procese mayores volúmenes de información y arrojen resultados más exactos para una mejor toma de decisiones.
Si MVM Ingeniería de Software S.A.S en sus procesos de análisis de información no incluye tipos de datos no estructurado los procesos de toma de decisiones que incluyen sus aplicaciones estará ofreciendo información limitada del negocio.
Vis
ual
izar
(vi
sual
izac
ión
de
info
rmac
ión
)
La información con la que se cuenta para la toma de decisiones es limitada. Toma de decisiones sin conocimiento pleno de la empresa y su estado.
Si MVM Ingeniería de Software S.A.S fortalece sus aplicaciones de analítica de negocios por medio de la gestión de grandes volúmenes de información desestructurada puede estar preparado para obtener, almacenar, procesar y analizar todo tipo de información.
Se considera que la cantidad y variedad de datos analizados mejora los procesos de toma de decisiones.
Si MVM Ingeniería de Software S.A.S no incluye dentro de sus aplicaciones de analítica de negocios información no estructurada estaría en una notable desventaja ante los desafíos y requisitos que exige el actual mercado. .
En el desarrollo de este capítulo se ha realizado el diagnostico del estado actual de la
unidad de análisis en el contexto de la gestión de grandes volúmenes de información para
la implementación de soluciones de analítica de negocios, analizando los resultados
obtenidos de partir de la aplicación del instrumento de recolección de información y
finalmente identificando tanto las debilidades, oportunidades, falencias como amenazas
que se presentan para MVM Ingeniería de Software S.A.S enfocándose en el trabajo con
datos de tipo no estructurado; Para las falencias identificadas, en el capítulo 4 se plantean
estrategias para gestión de grandes volúmenes de información las cuales buscan dar
solución a la problemática que actualmente se presenta dentro de la empresa.
64
CAPITULO 4. ESTRATEGIASPARA LA GESTION DE GRANDES
VOLUMENES DE INFORMACION PARA LA IMPLEMENTACION DE SOLUCION DE ANALITICA DE
NEGOCIOS EN MVM Ingeniería de Software S.A.S
De acuerdo a la metodología planteada en el numeral 1.5, a continuación se desarrolla la
tercera etapa “Planteamiento de Estrategias”, en la cual se proponen estrategias para la
gestión de grandes volúmenes de información que incluyan tipos de datos
desestructurados, a partir del marco conceptual elaborado en el segundo capítulo, en el
cual se hizo énfasis en Big Data como tendencia de bases de datos y en el diagnóstico
realizado a la unidad de análisis en el contexto de sus aplicaciones de analítica de
negocios, descrito en el capítulo tres.
A partir de las brechas identificadas con el análisis realizado en el capítulo anterior, el
cual se enfocó en estudiar la situación actual de MVM Ingeniería de Software S.A.S en
el contexto de sus aplicaciones de analítica de negocios; A continuación se plantean
estrategias para la gestión de grandes volúmenes de información para la implementación
de solución de analítica de negocios, buscando dar solución a las brechas anteriormente
mencionadas. Las estrategias están enlazadas a las diferentes fases de la gestión de la
información, como lo son la identificación (planeación y análisis), la consolidación
(obtención, transformación, la seguridad y almacenamiento de datos), el análisis
(procesamiento y análisis de datos) y la visualización (visualización de información). En
la figura 8, se ilustran las estrategias planteadas para el manejo de grandes volúmenes de
información.
65
Ilustración 8. Estrategias (Elaboración Propia)
66
En la Tabla 24, se especifican en detalle cada una de las estrategias planteadas en la
ilustración 8, indicando que se obtiene de cada una y el rol responsable de ejecutarlas,
estas estrategias se agrupan por las diferentes etapas para la gestión de la información en
el contexto de los grandes volúmenes de información no estructurada, propuestas por la
metodología ICAV.
Tabla 24. Planteamiento de Estrategias (Elaboración Propia)
Etapa Estrategia Descripción Responsable Producto
Iden
tific
ar (
pla
nea
ció
n y
anál
isis
) Conocer el objetivo
empresarial
Identificar el problema o necesidad a la cual se le debe dar solución, para enfocar todos los recursos, estrategias y herramientas en conseguir este objetivo.
Analista de Información D
ocu
men
to d
e requerim
iento
s
Identificar Impacto del análisis
Reconocer los clientes y usuarios potenciales (dueños de la información), ya que a partir de ellos se obtendrá información y datos los cuales se procesaran posteriormente y son a quienes llegara el análisis y resultado final del procesamiento de la información.
Analista de Información
Co
nso
lidar
(o
bte
nci
ón
de
dat
os) Identificar fuentes
de información
Identificar y seleccionar las fuentes de información internas y externas útiles al negocio enfocándose en dar solución al problema planteado. Se deben conocer los diferentes sistemas y/o aplicaciones que generan datos de valor alineados con la problemática identificada para tener en cuenta toda la información que ayudara al análisis y a la obtención de resultados.
Analista de Información C
olecció
n d
e dato
s recolectado
s
Identificar técnicas de recolección de
datos
Seleccionar las técnicas de recolección de datos más adecuadas enfocándose en dar solución al problema planteado
Arquitecto de Información
Validar accesibilidad y
permisos
Constatar que se cuente con los accesos requeridos y permisos necesarios para obtener los datos que se requieren para el análisis a realizar.
Arquitecto de Información
67
Etapa Estrategia Descripción Responsable Producto
Identificar información requerida
Identificar qué datos son realmente necesarios para dar solución a la problemática planteada, ya que de esta forma se enfocara esta etapa en obtener solo la información realmente importante para el problema en cuestión, optimizando esfuerzos y tiempo.
Analista de Información /
Cliente / Usuario
Identificar crecimiento de
datos
Conocer la cantidad de datos actuales con los que cuenta el negocio y los cuales se van a ser procesados, adicionalmente identificar el aumento periódico de estos datos y la velocidad con la que crecen. Con esta información, se determina la capacidad de almacenamiento y escalabilidad se requiere en el proyecto para dar solución al problema planteado.
Arquitecto de Información
Esp
ecificacion
es de la cap
acidad d
e alm
acenam
iento
Identificar herramientas de
almacenamiento de información
Determinar la capacidad de almacenamiento necesaria que requiere la solución a implementar para identificar de esta forma las herramientas para el almacenamiento de los datos, se debe tener en cuenta aspectos como el costo, la escalabilidad de la herramienta, la seguridad, la capacidad y la accesibilidad.
Arquitecto de Información
Esp
ecificacion
es de
herram
ientas d
e alm
acenam
iento
Co
nso
lidar
(tr
ansf
orm
ació
n d
e d
ato
s)
Validar información
Validar la veracidad de la información que se obtuvo en la etapa anterior y que será analizada posteriormente para la generación de resultados, ya que esto garantizara que se está trabajando con información real la cual otorgara resultados verídicos y confiables
Analista de Información /
Cliente
Co
lección
de d
atos tran
sform
ado
s
Interpretar información
Identificar el talento humano interno de la organización que tiene amplios conocimiento de la empresa y su entorno y puede interpretar de datos propios del negocio
Cliente / Usuario
68
Etapa Estrategia Descripción Responsable Producto
Validar estructura de información
Identificar la estructura adecuada que deben tener los datos para la herramienta de almacenamiento que se va a utilizar, con esto se busca eliminar posibles problemas al momento de almacenar la información. Adicionalmente se debe garantizar en este punto la consistencia e integridad de la información una vez se haya transformado
Analista de Información
Co
nso
lidar
(se
gu
rid
ad y
alm
acen
amie
nto
de
dat
os)
Plantear opciones de almacenamiento
Identificar otras opciones de almacenamiento de la información dependiendo de la necesidad del usuario y de la estructura del negocio. Por ejemplo se puede considerar el almacenamiento virtual (almacenamiento en la nube) cuando se trabaja con un cliente que posee varias sedes o almacena datos desde diferentes lugares al tiempo.
Arquitecto de Información
Co
lección
de d
atos alm
acenado
s
Seguridad de información
Determinar las acciones para garantizar la seguridad y persistencia de la información al ser almacenada. Por lo cual, es necesario contar con un plan de seguridad que ofrezca opciones de recuperación de información y restablecimiento de la misma
Arquitecto de Información / Analista de Información
Plan
de seg
urid
ad y
recup
eración d
e la in
form
ación
An
aliz
ar (
pro
cesa
mie
nto
y a
nál
isis
de
dat
os)
Enfocar análisis
Analizar la información correspondiente a la problemática, con el objetivo de identificar las variables claves y así se puede enfocar el estudio de los datos en éstas, con lo cual se garantice una solución a partir del alcance planteado.
Analista de Información
Co
lección
de in
form
ación p
rocesada
Procesar en paralelo
Implementar sistemas que permitan procesamiento de la información en paralelo para optimizar el análisis de datos haciendo este proceso más rápido y ágil.
Arquitecto de Información
69
Etapa Estrategia Descripción Responsable Producto
Identificación de técnicas
Identificar las técnicas de análisis de datos más adecuadas para suplir la necesidad del problema planteado, por ejemplo técnicas como: Reglas de Asociación, Clasificación, Minería de Datos, Modelos de Predicción, Algoritmos Genéticos, Redes Neuronales, entre otras.
Arquitecto de Información
Priorizar Información
Priorizar la información según su relevancia, es decir, se recomienda analizar primero la información obtenida desde fuentes internas al negocio y posteriormente desde fuentes externas, ya que estas últimas pueden generar información que no está totalmente centrada en el negocio y pueden distorsionar el enfoque que se tiene para dar solución al problema planteado.
Analista de Información
Analizar en tiempo real
Analizar la información en el momento en que llega al sistema, esto ofrece resultados totalmente actualizados dando una visión certera y actualizada del estado del negocio o de la situación que se evalúa.
Arquitecto de Información
Identificar herramientas de
procesamiento de información
Evaluar las herramientas de software y hardware necesarias que permitan el procesamiento ágil de grandes volúmenes de información enfocándose en dar solución al problema planteado
Arquitecto de Información
Comunicación
Es necesario establecer comunicación definiendo estándares y patrones entre quienes procesan y analizan los datos y quienes los van a utilizar como materia prima para su trabajo diario, ya que es necesario conocer que información es la que esperan los usuarios y enfocarse en esto para satisfacer sus necesidades.
Analista de Información /
Cliente / Usuario
70
Etapa Estrategia Descripción Responsable Producto V
isu
aliz
ar (
visu
aliz
ació
n d
e in
form
ació
n)
Identificar periodicidad
Se debe identificar la periodicidad que el usuario requiere tener a su alcance los resultados generados del análisis de la información, esto es conocer con qué frecuencia espera el usuario que la información se refresque en sus sistemas de visualización.
Analista de Información
Resu
ltado
s
Identificar responsables
Se deben identificar responsables por unidades de trabajo o áreas de trabajo para saber qué información se le debe entregar a cada persona o área, con esto se busca dar a conocer a cada persona lo que realmente necesita y no caer en el error de dar más información de la necesaria lo cual puede distorsionar el objetivo de análisis.
Analista de Información
Identificar herramientas de visualización y/o
presentación
Se deben identificar herramientas para la generación de reportes y visualización grafica de la información enfocándose en dar solución al problema planteado, es importante buscar mejorar la forma de mostrar la información enfatizando en conclusiones, esto facilita la toma de decisiones en la empresa.
Arquitecto de Información
Accesibilidad y la fluidez
Aplicar o implementar sistemas de búsqueda a partir de la información procesada y analizada para mejorar de la accesibilidad y la fluidez de la información dentro de la propia empresa.
Analista de Información
Usabilidad
Implementar sistemas de visualización usables los cuales contengan la información distribuida enfocándose en dar solución al problema planteado y permitiendo la fácil identificación de variables y puntos objetivos.
Arquitecto de Información / Analista de
Información / Cliente / Usuario
En la tabla 25, se describen los diferentes roles propuestos con sus respectivas
responsabilidades, para llevar a cabo las estrategias propuestas para la gestión de grandes
71
volúmenes de información en el contexto de soluciones de analítica de negocios en la
unidad de análisis.
Tabla 25. Descripción de Roles (Elaboración Propia)
Rol Descripción Responsabilidades
Analista de Información
El analista de información se encarga de la definición de requisitos funcionales y no funcionales a partir de la identificación de la necesidad del cliente. Además debe enfocar todos los recursos y herramientas para conseguir el objetivo planteado y velar por el correcto manejo de la información durante todo el proceso de desarrollo y finalmente validar que los resultados generados son coherentes con lo esperado por el cliente y/o usuario
• Identificar problema y/o necesidad del
cliente / usuario a partir de la elaboración de las preguntas de negocio.
• Identificar los clientes potenciales para el negocio, es decir, clientes quienes tengan una necesidad que puede ser suplida por los productos y/o servicios que ofrece la empresa.
• Identificar fuentes de información
internas y externas.
• Identificar datos de importancia para el negocio.
• Constatar la veracidad de la
información.
• Validar la seguridad y persistencia de la información.
• Identificar las variables claves para
enfocar el estudio de la información.
• Identificar la periodicidad para la generación de resultados (informes).
• Identificar responsables por unidades
de trabajo.
• Velar por la usabilidad de las soluciones a implementar.
Arquitecto de Información
El arquitecto de información tiene la responsabilidad de definir e implementar la estructura en cuanto al software y hardware que se requieren para el desarrollo de
• Identificar las técnicas de análisis y
recolección de datos.
72
la solución. A su vez, tiene el deber de velar por la seguridad e integridad de los datos y garantizar aspectos como los tiempos de respuesta y disponibilidad de las soluciones.
• Validación de accesos y permisos para las aplicaciones que intervengan dentro de la solución a implementar.
• Identificación del crecimiento de los
datos en el tiempo, según el número de usuarios que interactuaran y la disponilidad de la solución.
• Identificar capacidades y opciones de
almacenamiento.
• Garantizar la seguridad y persistencia de la información.
• Identificar las herramientas de
software y hardware para el procesamiento de información.
• Identificar herramientas para la
generación de reportes y visualización grafica de la información.
Cliente
El cliente (persona natural o jurídica) que expone una necesidad o problemática, a resolver, adicionalmente es quien se encarga de suministrar la información necesaria del negocio y los datos con los cuales se va a trabajar.
• Comunicar necesidad del negocio
• Apoyar el proceso de identificación de
requisitos funcionales y no funcionales del negocio.
• Identificar información necesaria y
clave para el negocio.
• Apoyar el proceso de validar la veracidad de la información.
• identificar el recurso humano interno
de la empresa con conocimientos requeridos para dar solución al problema planteado.
• Velar por la buena comunicación con
el equipo de trabajo.
• Apoyar procesos y tareas enfocadas en la usabilidad de los sistemas.
73
Usuario
El usuario (persona natural o jurídica) es quien utiliza la solución implementada en su trabajo diario, encargado consciente o inconscientemente de generar datos reales los cuales procesara y analizara la aplicación para la generación de resultados que permitan la toma de decisiones.
• Apoyar el proceso de identificación de
requisitos funcionales y no funcionales del negocio.
• Velar por la buena comunicación con el equipo de trabajo.
• Apoyar procesos y tareas enfocadas en la usabilidad de los sistemas
Una vez identificadas las falencias que presenta la unidad de análisis en el contexto de las
aplicaciones de analítica de negocios a partir del estudio realizado en el capítulo 3 y del
planteamiento de estrategias para la gestión de grandes volúmenes de información
detallas en la ilustración 8 y tabla 24 de presente capítulo, a continuación se realiza el
mapeo entre las brechas identificadas y as estrategias planteadas. En la tabla 26, se realiza
el mapeo entre las falencias identificadas en la unidad de análisis y las estrategias
planteadas.
Tabla 26. Falencias Identificadas y Estrategias de Solución (Elaboración Propia)
Etapa Falencia Estrategia Solución Estrategia
Identificación (planeación y
análisis)
Información descartada en el
análisis y diseño de soluciones
Conocer el objetivo empresarial
Conociendo claramente la necesidad del cliente se sabrá si la información de tipo no estructurada debe ser tenida en cuenta y de ser así los procesos de análisis y diseño al deben incluir.
Identificar Impacto del análisis
Consolidación (obtención de
datos)
Fuentes de Información Limitadas
Identificar información requerida
Se identificaran otras fuentes de información que ofrezcan más datos para la solución de analítica de negocios
Identificar fuentes de información
Fuentes de Información Descartadas
Identificar técnicas de recolección de datos Se contara con las técnicas y
herramientas adecuada s que permitan tener en cuenta fuentes de información que generen datos no estructurados.
Identificar herramientas de almacenamiento de información
Identificar herramientas de procesamiento de información
Consolidación (transformación
de datos)
Dificultad en el desarrollo de soluciones de analítica de
negocios por los
Identificar herramientas de almacenamiento de información
Se identificaran y utilizaran las herramientas necesarias para trabajar con datos de tipo no estructurado sin que esto presente algún tipo de
Validar estructura de información
74
Etapa Falencia Estrategia Solución Estrategia
datos de tipo desestructurados
Identificar herramientas de procesamiento de información
dificultad en el desarrollo de soluciones de analítica de negocios.
Identificar herramientas de visualización y/o presentación
No se usan herramientas
especializadas para datos de tipo
desestructurado
Identificar herramientas de almacenamiento de información
Con la utilización de datos de tipo no estructurado se implementaran las herramientas especializadas en el manejo de estos datos.
Identificar herramientas de procesamiento de información
Consolidación (seguridad y
almacenamiento de datos)
No se usan bases de datos
especializadas para datos de tipo
desestructurado
Validar estructura de información
Con la utilización de datos de tipo no estructurado se implementaran las bases de datos especializadas en el manejo de estos datos.
Identificar herramientas de almacenamiento de información
Análisis (procesamiento y análisis de datos)
Dificultad en el procesamiento y
análisis de datos de tipo
desestructurado
Validar estructura de información
Al utilizar las herramientas y técnicas enfocadas en los datos de tipo no estructurado, esta información no representara una dificultada al momento de procesarla.
Identificar herramientas de procesamiento de información
Identificación de técnicas
Información descartada
Identificar técnicas de recolección de datos
La implementación de las herramientas adecuadas en las diferentes etapas de la gestión de la información y de las técnicas de recolección de datos de tipo no estructurado permitirán analizar gran cantidad de información evitando que aluna de esta se tenga que descartar por su estructura.
Validar estructura de información Identificar herramientas de almacenamiento de información
Identificación de técnicas
Identificar herramientas de procesamiento de información
Volumen de información
limitado
Identificar herramientas de almacenamiento de información
Las herramientas adecuadas para el almacenamiento y procesamiento de la información permitirán manejar mayores volúmenes de datos.
Identificar herramientas de procesamiento de información
Tiempos de respuesta no
óptimos
Identificar herramientas de almacenamiento de información
Al utilizar técnicas que permitan el procesamiento de información en paralelo además de implementar las herramientas que se enfoquen en el trabajo con grandes volúmenes de información se podrán mejorar los tiempos de respuesta de las soluciones de analítica de negocios.
Procesar en paralelo
Identificar herramientas de procesamiento de información
Identificar crecimiento de datos
Analizar en tiempo real
75
Etapa Falencia Estrategia Solución Estrategia
Visualización (visualización de
información)
Toma de decisiones a partir
de información limitada
Identificar fuentes de información
La correcta selección de las fuentes de datos como las técnicas de recolección de información apropiadas en conjunto con las herramientas enfocadas en el manejo de grandes volúmenes de información permitiría procesar mayores volúmenes de información de diferente tipo para tener un conocimiento más amplio del negocio.
Identificar técnicas de recolección de datos
Identificar herramientas de almacenamiento de información
Identificar herramientas de procesamiento de información
Identificar herramientas de visualización y/o presentación
Toma de decisiones a partir de conocimiento
parcial
Conocer el objetivo empresarial
La identificación de los aspectos claves para la implementación de soluciones de analítica de negocios, como conocer el objetivo empresarial, las herramientas adecuadas y conocer que espera el cliente del sistema es clave para que el proceso final de toma de decisiones se realice con conocimiento de todas las variables e información disponible.
Identificar fuentes de información Identificar información requerida Identificar herramientas de almacenamiento de información
Identificar herramientas de procesamiento de información
Identificar herramientas de visualización y/o presentación
Identificar periodicidad Identificar responsables
76
CAPITULO 5. CONCLUSIONES, LECCIONES APRENDIDAS Y
RECOMENDACIONES
5.1 Conclusiones De acuerdo con los objetivos planteados en el presente estudio de caso, se puede concluir
que la gestión de grandes volúmenes de información es clave para la generación de
conocimiento dentro de las empresas, lo cual además de convertirse en una ventaja
competitiva permite una mejor toma de decisiones. Una empresa como MVM Ingeniería
de Software S.A.S la cual desarrolla soluciones de analítica de negocios para empresas
como Interconexión Eléctrica S.A. E.S.P. (ISA), Empresas Públicas de Medellín (EPM),
ISAGEN, XM S.A. E.S.P., Central Hidroeléctrica de Caldas S.A. E.S.P (CHEC), UNE
EPM Telecomunicaciones S.A., entre otros, debe poseer el conocimiento necesario para
la gestión de grandes volúmenes de información obtenida desde diferentes fuentes de
información no estructurada ya que es desde aquí donde se obtiene conocimiento para
identificar tendencias y comportamientos que permiten enfocar los objetivos del negocio.
Por lo cual, es conveniente la implementación de las estrategias para la gestión de grandes
volúmenes de datos por medio de Big Data en el contexto de la analítica de negocios
propuestas en el presente trabajo. La realización del marco conceptual permitió tener las
bases teóricas y conceptuales para entender la temática de la investigación y en conjunto
con el instrumento de recolección elaborado se realizó el diagnostico a la unidad de
análisis y posteriormente el planteamiento de las estrategias para la gestión de grandes
volumen de información. Con la generación del marco conceptual adicionalmente se
identificaron las diferentes etapas del ciclo de vida de la información enfocada en los
grandes volúmenes de datos no estructurados lo cual permite que se tenga una
metodología coherente para el desarrollo de este tipo de soluciones y se lograron conocer
los aspectos de mayor relevancia en el tratamiento de datos de este tipo a partir de lo cual
se realizó el planteamiento de las estrategias. Igualmente con la aplicación de la encuesta
al personal experto en gestión de información de MVM Ingeniería de Software S.A.S se
evidencio que dentro de la empresa se tienen la conciencia de la importancia que
representa el procesamiento de grandes cantidades de información no estructurada para
77
la toma de decisiones, se tiene claro la estructura física y conceptual con la que se deben
abordar las aplicaciones de analítica de negocios que incluyan datos de este tipo y se
poseen conocimientos amplios en cuanto a la seguridad de la información y los elementos
que se deben tener en cuenta para este punto, pero en las soluciones que actualmente se
desarrollan la utilización de la información no estructurada es mínima ya que se considera
que estos tipos de datos son una dificultad para la implementación de las aplicaciones, las
fuentes de información a partir de la cuales se obtienen los datos para analizar se limitan
por el tipo de información que generan, la utilización de herramientas y bases de datos
especializadas en la gestión de información de tipo no estructurada es mínima, las
cantidades de información que actualmente procesan y analizan las aplicaciones de
analítica de negocios son limitadas tanto por las fuentes de información que se emplean
como por las herramientas utilizadas y se hace necesario descarta información que puede
llegar ser clave para el negocio por su estructura.
Para la correcta implementación de las estrategias propuestas que dan solución a las
falencias identificadas se deben incorporar dentro de las soluciones de analítica de
negocios todo tipo de fuente de información que genere datos importantes para el negocio,
no solo limitarse a los orígenes de datos tradicionales como las bases de datos relacionales
y archivos planos que son los orígenes de información utilizados en actualidad para las
soluciones de analítica de negocios en MVM Ingeniería de Software S.A.S,
adicionalmente desde la etapa de análisis y diseño se debe contemplar el trabajo con datos
no estructurados para incluirlos desde el inicio en todo el proceso del desarrollo de las
soluciones, además es necesario el trabajo con herramientas y bases de datos diseñadas
especialmente para el almacenamiento, procesamiento, análisis y visualización de este
tipo de datos para permitir a la vez trabajar con mayores volúmenes de información y con
tiempos de respuesta óptimos, de esta forma MVM Ingeniería de Software S.A.S podrá
contar dentro de sus soluciones con mayores volúmenes de información que generaran
más conocimiento y una visión más amplia del negocio para el mejoramiento del proceso
de toma de decisiones.
Por último, a continuación se ilustran conclusiones adicionales producto del ejercicio
investigativo realizado:
78
• Los grandes volúmenes de datos han tomado cada vez mayor importancia en el
desarrollo de los negocios y en las organizaciones, su uso es cada vez más relevante
y clave en los escenarios de evolución de las empresas, por esto la importancia del
correcto manejo y gestión de los grandes volúmenes de información
• Big Data crea valor de muchas maneras diferentes, cuando se usa correctamente
permite una mejor utilización de la información. Los datos son fundamentales para
mejorar el rendimiento y comprender mejor el contexto en que se mueven las
organizaciones, estos ayudan a entender mejor los clientes, el público y el mercado
en general. A través de los datos se puede anticipar las necesidades y conocer de una
manera más activa las demandas de los consumidores, estableciendo estrategias de
acción concretas.
• Las formas en las que a partir del tratamiento masivo de datos se pueden crear valor
son: Hacer la información transparente y utilizable más frecuentemente. Las
organizaciones que crean y almacenan más datos transaccionales en forma digital,
pueden recopilar información de rendimiento más precisa y detallada, y por lo tanto,
mejorar el rendimiento. El tratamiento masivo de datos permite la segmentación cada
vez más estrecha de los clientes y por lo tanto, los productos pueden ofrecerse de forma
más precisa. Se puede mejorar sustancialmente la toma de decisiones. Y finalmente,
el tratamiento masivo de datos se pueden utilizar para mejorar el desarrollo de la
próxima generación de productos y servicios a crear.
5.2 Lecciones Aprendidas
En el desarrollo de este proyecto de resalta como lecciones aprendidas la importancia de
la realización del marco conceptual ya que permite que se tenga un soporte teórico a la
investigación y una recopilación de información base del tema tratado, lo cual en conjunto
con el instrumento de recolección de información empleado (encuesta) permiten realizar
un diagnóstico de la unidad de análisis para conocer la problemática actual que presenta
la empresa, así como para identificar las fortalezas y falencias en cuanto a la gestión de
grandes volúmenes de información.
79
5.3 Recomendaciones
Se sugiere para un próximo trabajo de investigación, implementar las estrategias para la
gestión de grandes volúmenes de datos por medio de Big Data en el contexto de la
analítica de negocios propuestas en el presente documento enfocadas en el estudio de
caso de MVM Ingeniería de Software S.A.
80
REFERENCIAS
Big Data Consulting. Metodología. Recuperado de http://bigdataconsulting.wordpress.com/consulting/methodology/
Business Brio. Big Data. Recuperado de http://www.businessbrio.com/big-data.html Bustelo, Carlota & García, Elisa (2001). Tendencias en la gestión de la información, la
documentación y el conocimiento en las organizaciones.Recuperado dehttp://b3.bibliotecologia.cl/ar-tendencias.htm
Calderale, Hernán (2012). Big Data: la clave es analizar, no acumular. Recuperado de
http://www.ca.com/cl/news/press-releases/latam/2012/big-data-la-clave-es-analizar-no-acumular.aspx
CBIG Consulting. CBIG Framework. Recuperado de
http://www.cbigconsulting.com/approach/big-data-analytics-framework/ Centro de Telemedicina de Colombia (2014). Tecnologías de la Información y las
Comunicaciones TIC's. Recuperado de http://www.colombiantelemed.com/index2.php?option=com_content&do_pdf=1&id=27
Computerworld (2012). Big Analytics, la evolución de BI y Business Analytics.
Recuperado dehttp://www.computerworldmexico.mx/Articulos/22988.htm Developer Works. ¿Qué es Big Data?.Recuperado de
http://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/ Diario de Tecnología Empresarial (2013). Tres casos de éxito de Big Data en
Colombia.Recuperado de http://empresas.it/2013/05/tres-casos-de-exito-de-big-data-en-colombia/
Dyche, Jill (2013). Los siete pasos de la entrega del big data. Recuperado de
http://www.sas.com/offices/europe/spain/IQ/Q113/EMPEZARCONELBIGDATA.pdf
81
Fernández, Elmer. Entendimiento de los Datos. Recuperado de http://www.uccor.edu.ar/paginas/seminarios/Cursos/DM-Medicine/Phase2-b.pdf
Fidelity Worldwide Investment (2012). Big data: una "revolución industrial" en la
Gestión de los datos digitales. Recuperado de https://www.fondosfidelity.es/static/pdfs/informes-fondos/Fidelity_ArgInvSXXI_BigData_Sept12_ES.pdf
Figueroa Andrinis, Ingrid Francis. Definición de TIC. Recuperado de
http://www.creadess.org/index.php/comparte/2012-02-10-21-38-04/blogs-creadess/pdf?id=5733
García Orozco, Javier Francisco. Gestión de la Información y el Conocimiento.
Recuperado de http://www.observatoriovirtual.udg.mx/_documentos/Gestiondelconocimiento_Javier%20Garcia-1.pdf
Góngora, Genny. Tecnología de la información como herramienta para aumentar la
productividad de una empresa. Recuperado de http://www.tuobra.unam.mx/publicadas/040702105342.html
Ibermatica (2011). El tratamiento masivo de datos (Big Data): La próxima frontera para
la innovación, la competencia, y la productividad. Recuperado dehttp://rtdibermatica.com/?p=319
Information Management. ¿Qué es la gestión de la información?.Recuperado de
http://informationmanagement.wordpress.com/2006/11/28/%C2%BFque-es-la-gestion-de-la-informacion-3-de-4/
Innovation Edge (2013). BBVA y Big Data. Recuperado
dehttps://www.centrodeinnovacionbbva.com/innovation-edge/21-big-data/p/156-bbva-y-big-data
Martínez Carazo. Estudio de caso. Recuperado
dehttp://www.udlap.mx/intranetWeb/centrodeescritura/files/notascompletas/estudiodeCaso.pdf
Presidencia de la República (2010). Gestión de la Información. Recuperado de
http://www.accioncontraminas.gov.co/accion/Paginas/GestionInformacion.aspx
82
Pomares, Alexandra (2013). Uno. Inteligencia analítica en el sector salud. Recuperado
de http://acis.org.co/revistasistemas/index.php/component/k2/item/146-uno-inteligencia-anal%C3%ADtica-en-el-sector-salud
Rodríguez, José Manuel. Seguridad ante el fenómeno Big Data. Recuperado de
http://www.redseguridad.com/empresas/fabricantes/seguridad-ante-el-fenomeno-big-data
Rodríguez Salas, Karla (2012). Gestión De La Información En Las Organizaciones.
Recuperado de http://www.accioncontraminas.gov.co/accion/Paginas/GestionInformacion.aspx
Ruiz Blanco, Gabriel (2012). Tecnologías De Información Y Comunicación. Recuperado
de http://www.buenastareas.com/ensayos/Tecnologias-De-Informacion-y-Comunicacion/6084522.html
Saima (2013). Business Intelligence y Big Data, ¿independencia o
cooperación?.Recuperado de http://www.saimasolutions.com/blog/business-intelligence-big-data/
Thompson, Iván. Definición de Información. Recuperado de
http://www.promonegocios.net/mercadotecnia/definicion-informacion.html Yacuzzi, Enrique. El Estudio De Caso Como Metodología De Investigación: Teoría,
Mecanismos Causales, Validación. Recuperado de http://www.ucema.edu.ar/publicaciones/download/documentos/296.pdf
Zarahi, Murillo &Maria, Castro. & Brenda, Solis. & Tania Ronquillo (2011).Enfoques Cuantitativo Y Cualitativo De La Investigación En Ciencias Sociales.Recuperado de http://www.tlalpan.uvmnet.edu/oiid/download/Enfoques%20cualitativo%20cuantitativo_04_CSO_PSIC_PICS_E.pdf
83
ANEXOS
84
ANEXO A. ENCUESTA
Propósito: En el marco de la especialización de Gestión de Información y Bases de Datos de la Universidad de San Buenaventura (seccional Medellín), los profesionales Isabel Cristina Gómez Diaz y Esneyder Ardila Cañas se encuentran desarrollando su proyecto de grado, que tiene como propósito realizar una investigación de tipo cualitativa, donde se emplea el método de estudio de caso y la unidad de análisis es la empresa MVM Ingeniería de Software S.A.S, con el objetivo de plantear Estrategias para la Gestión de Grandes Volúmenes de Datos por Medio de Big Data en el Contexto de la An alítica de Negocios: Caso MVM Ingeniería de Software S.A.S. Los resultados que se obtengan en esta investigación, MVM podrá recibirlos como insumos para tenerlos en cuenta en los proyectos que desarrolla en el contexto de la analítica de negocios. A su vez, sus contribuciones serán importantes para el proceso de desarrollo académico de los profesionales involucrados en esta investigación. Por último, la información que se obtenga será manejada bajo estricta confidencialidad y solo tendrá los fines académicos antes mencionados. Objetivo: El objetivo de este instrumento de recolección de información (tipo encuesta) es conocer la opinión de expertos de MVM Ingeniería de Software S.A.S en el contexto de la gestión de gestión de la información y analítica de negocios, con el fin de recibir sus contribuciones en relación a la gestión de grandes volúmenes de información estructurada y desestructurada para la implementación de soluciones y/o proyectos de Big Data. Preguntas: Las preguntas de la 1 a la 3 son de tipo única resp uesta. Se debe seleccionar solo una de las opciones presentadas. 1. ¿En la actualidad las soluciones implementadas o que se encuentran en
etapa de desarrollo por parte MVM Ingeniería de Software S.A.S , utilizan grandes cantidades de datos de tipo desestructurado obtenidos desde diferentes fuentes de información diferentes a las bases de datos relacionales?
Seleccione una opción.
85
o Si o No
2. ¿Considera que los grandes volúmenes de datos que se encuentran en forma
desestructurada representan una dificultad para el desarrollo de soluciones de analítica de negocios dentro de MVM Ingeniería de Software S.A.S ?
Seleccione una opción.
o Si o No
3. ¿Considera que la implementación, procesamiento, análisis y manejo de
grandes volúmenes de datos (Big Data) en el contexto de la analítica de negocios puede mejorar la toma de decisiones a partir de la información ofrecida por las soluciones que actualmente desarrolla MVM Ingeniería de Software S.A.S ?
Seleccione una opción.
o Si o No
Si la respuesta de la pregunta anterior fue Si continúe por favor en la pregunta número 4 de lo contrario continúe en la pregunta 5
4. ¿Qué beneficios considera que puede ofrecer la implementación, procesamiento, análisis y manejo de grandes volúmenes de datos en el contexto de la analítica de negocios, las soluciones que actualmente desarrolla MVM Ingeniería de Software S.A.S ?
Selecciones las opciones que apliquen.
□ Mayor conocimiento del mercado a partir de la identificación de
tendencias y comportamiento de los clientes, lo cual facilitara tomar decisiones más acertadas referentes a la creación y promoción de productos y/o servicios
□ Análisis de mayores volúmenes de información permitiendo tener en cuenta diversas fuentes de datos, lo cual facilitara tomar decisiones más acertadas referentes al negocio en general
□ Conocimiento de las necesidades y preferencias de los clientes, lo cual facilitara tomar decisiones más acertadas en cuanto a la orientación de productos y/o servicios para satisfacer necesidades de los clientes de forma especifica
86
□ Conocimiento y procesamiento de información interna y externa del negocio, lo cual facilitara tomar decisiones más acertadas referentes a la expansión, alianzas y oportunidades de negocio que tiene la empresa
□ Identificación de variables claves para el negocio, lo cual permitirá tomar decisiones para la empresa a partir de un análisis más detallado y especializado
□ Identificación de sistemas de información que tienen mayor influencia para los usuarios, lo cual permitirá tomar decisiones en cuanto a la necesidad de implementar nuevos sistemas de información internos y externos a la empresa
□ Otro: __________________________________________________
Las preguntas de la 5a la 23son de selección múltip le. Se debe seleccionar una o varias de las opciones ofrecidas según su res puesta. 5. Las soluciones de Analítica de Negocios que son desarrolladas actualmente
por parte de MVM Ingeniería de Software S.A.S integran información de diversas fuentes de información empresarial como.
Selecciones las opciones que apliquen.
□ Sistemas de facturación □ Sistemas comerciales □ ERP (Sistemas de planificación de recursos empresariales) □ CRM (Sistemas para la gestión de relaciones con el cliente) □ Sistemas de información gerencial □ Sistemas para el control y mejoramiento de procesos □ Aplicaciones de redes sociales □ Sistemas de medición inteligente □ Sistemas de información geográfica □ Otro: ________________________________________________
6. Para las soluciones de Analítica de Negocios que son desarrolladas actualmente por parte de MVM Ingeniería de Software se hace necesario incluir diversos tipos de información obtenida desde diversas fuentes como: Selecciones las opciones que apliquen.
□ Bases de Datos Relacionales □ Archivos Planos (.xls, .txt, .xml) □ Foros □ Videos
87
□ Redes Sociales □ Imágenes □ Audios □ Blogs □ Otro: ________________________________________________
7. ¿Qué aspectos considera de mayor importancia al momento de analizar
información de tipo Big Data dentro de soluciones basadas en Analítica de Negocios que permitan la posterior toma de decisiones?
Selecciones las opciones que apliquen.
□ Variedad de Datos □ Volumen de Datos □ Velocidad de Procesamiento de Información □ Diversidad de Fuentes de Información □ Tiempos de Respuesta □ Resultados Precisos □ Seguridad de Datos □ Visualización y/o Presentación de la Información □ Otro: ___________________________________________________
8. ¿Qué limitaciones y/o dificultades considera usted que actualmente
presentan las soluciones enfocadas en Analítica de Negocios para la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S ?
Selecciones las opciones que apliquen.
□ Tiempos de respuestas no son óptimos en cuanto a la información que se procesa para la toma de decisiones
□ Resultados con un margen de error igual o superior al 30% a partir de del análisis realizado a la información
□ Limitaciones en cuanto al volumen de información a procesar para la posterior toma de decisiones
□ Limitaciones al seleccionar las fuentes de información de donde se obtendrán los datos a procesar
□ Selección detallada de los tipos de datos que se procesaran □ Información que no puede ser tenida en cuenta para ser procesada por
su tipo y/o estructura □ Bajos niveles de seguridad para la integridad, confiabilidad y
accesibilidad de la información □ Otro: ___________________________________________________
88
9. ¿De qué manera considera usted que podrían fortalecerse los resultados ofrecidos por las soluciones enfocadas en la toma de decisiones que desarrolla MVM Ingeniería de Software S.A.S si se incorpora Big Data?
Selecciones las opciones que apliquen.
□ Mejor toma de decisiones □ Conocimiento de tendencias, comportamientos y necesidades en el
contexto del mercado actual en el cual se enfoca la empresa □ Mayor conocimiento de los tipos y segmentos de clientes □ Precisión en la identificación de servicios y/o productos para satisfacer
necesidades de los clientes de forma específica □ Identificación de necesidades propias de la empresa en el contexto del
mercado actual □ Visión general del mercado (clientes, competidores, proveedores,
aliados, etc.) □ Mejoramiento de la accesibilidad de información dentro de la empresa □ Evaluación para la creación y/o rediseño de productos y servicios
internos □ Identificación de múltiples variables sobre el comportamiento y
desempeño de la unidad de análisis en los proyectos (clientes, ventas, costos, gastos, indicadores)
□ Ampliar variables en los tableros de desempeño que se desarrollen. □ Reducción en costos relacionados con estudios de mercado ya que se
tendrá un amplio conocimiento de las necesidades y tendencias de los usuarios
□ Identificación de posibles opciones de crecimiento para el negocio al conocer globalmente la aceptación de los productos y/o servicios que ofrece al empresa
□ Identificación de posibles alianzas estratégicas al conocer a nivel global otras empresas que pueden ofrecer productos y/o servicios que complementen los propios de la empresa
□ Otro: ___________________________________________________
10. ¿En la actualidad que tipo de información no se tiene en cuenta en las soluciones de toma de decisiones desarrollados por MVM Ingeniería de Software S.A.S por su estructura o por las limitaciones propias de la herramienta de Inteligencia de Negocios?
Selecciones las opciones que apliquen.
□ Información de bases de datos relacionales □ Información de archivos planos
89
□ Información de documentos de texto □ Información contenida en foros □ Información expuesta en redes sociales □ Información contenida en archivos multimedia (imágenes, audio,
video) □ Ninguna de las anteriores
11. ¿Por qué considera necesario el mejoramiento de los procesos de análisis y
procesamiento de grandes cantidades de información desestructurada en las soluciones de analítica de negocios que se desarrollan en MVM Ingeniería de Software S.A.S ?
Selecciones las opciones que apliquen.
□ Se puede tener en cuenta todas las fuentes que generan información administrativa, financiera, comercial y de mercado dentro de la empresa
□ Permite analizar todos los datos con los que cuenta la empresa □ Permite obtener resultados más acertados y precisos ya que
analizaran mayores volúmenes de información □ Permite conocer las tendencias de mercado con las cuales tienen
relación el usuario □ Permite conocer las necesidades actuales de los usuarios en cuanto
a productos y/o servicios que ofrece la empresa □ Se podrán enfocar los servicios y/o productos generados por la
empresa para determinados grupos de clientes según sus necesidades
□ Obtener un mejor conocimiento de los clientes y el mercado gracias a que se analizara toda la información disponible y que ha sido generada por ellos mismos
□ Ninguna de las anteriores □ Otro: ___________________________________________________
12. ¿En la actualidad que dificultades se presentan en las soluciones de Analítica
de Negocios que se desarrollan por parte de MVM Ingeniería de Software S.A.S, por no incluir tipos de datos desestructurados obtenidos desde diferentes fuentes de información?
Selecciones las opciones que apliquen.
□ Dificultad al no permitir el procesamiento de toda la información que genera la empresa (cliente objetivo).
90
□ Dificultad al descartar determinadas fuentes de información por la estructura de los datos que manejan
□ Dificultad al permitir solo conocimiento parcial y no general de la empresa (cliente objetivo).
□ Dificultad al limitar el formato de los datos a procesar □ Dificulta al identificar plenamente las necesidades de los clientes □ Toma de decisiones sin conocimiento completo de la empresa y/o del
mercado □ Ninguna de las anteriores. □ Otro: ___________________________________________________
13. ¿Qué aspectos considera que se deben tener en cuenta en la seguridad de
los datos en el contexto de la gestión de grandes volúmenes de información en las soluciones de Analítica de Negocio desarrolladas por MVM Ingeniería de Software S.A.S ?
Selecciones las opciones que apliquen.
□ Integridad de la Información □ Protección de los niveles de accesibilidad de la información a partir de
la creación y definición de perfiles y roles □ Alternativas de recuperación de información □ Opciones de respaldo y copias de seguridad de los datos □ Implementación de sistemas de cifrado para garantizar la
confidencialidad e integridad de los datos □ Protección contra accesos ilegales a bases de datos a través de las
tareas de administración de sistemas. □ Análisis de la procedencia de los datos □ Control de acceso y seguridad de la comunicación con otros sistemas
de información □ Control de acceso desde determinadas terminales y ubicaciones
(Control de acceso granular) □ Otro: ___________________________________________________
14. ¿Cuáles técnicas y/o herramientas considera más eficientes para garantizar
el respaldo y seguridad de la información de un proyecto de analítica de negocio que incluya información desestructurada obtenida desde diferentes fuentes de información?
Selecciones las opciones que apliquen.
□ Servidores de respaldo □ Almacenamiento en la nube (cloud computing)
91
□ Respaldos periódicos □ Bases de datos paralelas □ Encriptación de datos □ Otro: ___________________________________________________
15. ¿En qué aspectos considera que el conocimiento obtenido de los datos
procesados y analizados generan ganancias económicas para aquellas empresas que implementen soluciones las cuales utilicen grandes volúmenes de datos desestructurados?
Selecciones las opciones que apliquen.
□ Reducciones de los costos de publicidad ya que se conocen tanto las necesidades como los usuarios específicos a los cuales se deben dirigir los productos y/o servicios de la empresa
□ Reducciones en los costos de estudios de mercado ya que se podrán conocer las tendencias actuales del mercado
□ Incremento en las ventas ya que se dirigirán los recursos de la empresa en ofrecer productos y/o servicios a usuarios específicos que requieran realmente el bien o servicio que ofrece al empresa
□ Nivelación en precios de venta de productos ya que se tendrá un conocimiento general del mercado
□ Reducción en los costos de compra de materia prima ya que se podrán tener un mayor conocimiento del mercado específicamente de proveedores a niveles nacional e internacional
□ Optimización del proceso de inversión ya que se podrán conocer las tendencias del mercado y con esto realizar inversión en áreas puntuales de la empresa para responder a dichas tendencias
□ Otro: ___________________________________________________
16. ¿En qué aspectos considera que el costo invertido en talento humano y tecnología para la implementación de proyectos que involucren datos desestructurados se ve retornado para la empresa?
Selecciones las opciones que apliquen.
□ Mayor conocimiento del negocios □ Identificación de las necesidades específicas de los usuarios □ Visión actual de las tendencias del mercado □ Identificación de posibles clientes potenciales □ Identificación de opciones de expansión y crecimiento del negocio □ Identificación de posibles alianzas estratégicas para la empresa
92
□ Identificación de opciones de mejoramiento para los productos y/o servicios que ofrece la empresa
□ Otro: ___________________________________________________
17. ¿Dentro de MVM Ingeniería de Software S.A.S cuáles aspectos son tenidos en cuenta al momento de plantear la arquitectura para la implementación de proyectos de analítica de negocios que involucren información de tipo Big Data?
Selecciones las opciones que apliquen.
□ Disponibilidad □ Escalabilidad □ Flexibilidad □ Costo □ Rendimiento □ Ninguna de las anteriores
18. ¿Cuáles de las siguientes etapas se tienen en cuenta en el desarrollo de
soluciones de analítica de negocios realizados por MVM Ingeniería de Software S.A.S, en los cuales utilizan grandes volúmenes de datos desestructurados para la toma de decisiones?
Selecciones las opciones que apliquen.
□ Preparación e identificación de las preguntas de negocio. □ Obtención de datos □ Preparación y transformación de los Datos □ Almacenamiento □ Procesamiento y análisis de información □ Visualización y generación de resultados □ Revisión periódica □ Otro: __________________________________________________
19. ¿Cuáles aspectos son tenidos en cuenta para el planteamiento de los
requisitos de negocio en las soluciones de analítica de negocio basadas en la gestión de grandes volúmenes de información desarrolladas por MVM Ingeniería de Software S.A.S?
Selecciones las opciones que apliquen.
□ Diagramación del negocio actual, utilizando para esto diagramas de casos de uso, diagramas de estado, diagramas de secuencia, diagramas de objetos, diagrama de actividades, entre otros…
93
□ Diagramación de la solución implementar, utilizando para esto diagramas de casos de uso, diagramas de estado, diagramas de secuencia, diagramas de objetos, diagrama de actividades, entre otros…
□ Diagramación del modelo de datos inicial a implementar □ Implementación de técnicas de transferencia de conocimiento □ Definición de requisitos funcionales y no funcionales □ Conocimiento general del clientes (visión, misión y objetivos) □ Implementación de técnicas para el conocimiento de la necesidad
actual del cliente como reuniones, entrevistas y encuestas □ Identificación de la plataforma actual y sistemas de información con los
que cuenta el cliente □ Otro: __________________________________________________
20. ¿Cuáles aspectos físicos considera de mayor importancia al momento de
implementar una plataforma la cual soporte un sistema basado en analítica de negocios para el procesamiento de grandes volúmenes de información estructurada y desestructurada para la toma de decisiones?
Selecciones las opciones que apliquen.
□ Redes □ Servidores □ Discos de almacenamiento □ Sistemas operativos □ Virtualización □ Memoria para el procesamiento □ Herramientas de administración de requisitos □ Procesamiento en paralelo □ Otro: __________________________________________________
21. ¿Qué tipos de bases de datos se han implementado en las soluciones de
analítica de negocios desarrolladas dentro de MVM Ingeniería de Software S.A.S los cuales involucran grandes cantidades de información estructurada y desestructurada?
Selecciones las opciones que apliquen.
□ Bases de datos relacionales □ Bases de datos documentales □ Bases de datos en grafo □ Bases de datos clave/valor □ Bases de datos multivalor
94
□ Bases de datos orientadas a objetos □ Bases de datos tabulares □ Ninguna de las anteriores.
22. ¿Qué herramientas son utilizadas dentro de MVM Ingeniería de Software
S.A.S para el desarrollo de soluciones de Analítica de Negocios los cuales incluyen grandes cantidades de información estructurada y desestructurada?
Selecciones las opciones que apliquen
□ Hadoop □ Mongo DB □ OrientDB □ Objectivity/DB □ SimpleDB □ BigTable □ Dynamo □ CouchDB □ Ninguna de las anteriores □ Otro: __________________________________________________
23. ¿Cuáles aspectos considera de mayor importancia al momento de enfrentar
una solución de analítica de negocios basada en el procesamiento de grandes cantidades de información estructurada y desestructurada?
Selecciones las opciones que apliquen
□ Conocimiento del negocio □ Conocimiento de la necesidad del usuario □ Conocimiento de la Información interna útil al negocio □ Conocimiento de la Información externa útil al negocio □ Variedad de fuentes de información □ Infraestructura (Herramientas de software y hardware para el
procesamiento de información) □ Recurso humano con conocimiento y experiencia en el tema □ Accesibilidad a la información □ Seguridad de la información □ Otro: ___________________________________________________