tfgprototipodesistemadeinteligenciadenegocios-131002134719-phpapp02

182
Ingeniería en Informática Tesis de Grado Prototipo de Sistema de Inteligencia de Negocios utilizando Minería de Datos sobre Software Libre Nicolás Chávez Christian Bavera Tutor: Lic. Denise Riveros Asunción Paraguay 2.013

Upload: cristian-chamba

Post on 24-Nov-2015

23 views

Category:

Documents


0 download

TRANSCRIPT

  • Ingeniera en Informtica

    Tesis de Grado

    Prototipo de Sistema de Inteligencia de Negocios

    utilizando

    Minera de Datos sobre Software Libre

    Nicols Chvez

    Christian Bavera

    Tutor: Lic. Denise Riveros

    Asuncin Paraguay

    2.013

  • RESUMEN

    El propsito de este proyecto fue demostrar la factibilidad de la realizacin de un

    prototipo de solucin de Inteligencia de Negocios basado en software libre y

    minera de datos, enfocado a dar soporte a la toma de decisiones estratgicas del

    Grupo Flayp, ya que sus empresas almacenan sus datos en fuentes y formatos

    diferentes. Para ello se relevaron los sistemas actuales,procesos, requerimientos y

    tecnologas vigentes. Logrando la concrecin del prototipo, utilizando para ello

    las herramientas disponibles bajo licencia de software libre. Evidenciando que

    estas herramientas, son una alternativa vlida para soluciones de este tipo, sin la

    necesidad de incurrir en gastos por el pago de licencias de software propietario.

    Palabras Claves: inteligencia de negocios, software libre, minera de datos.

  • DEDICATORIA

    Dedico este esfuerzo personal y este logro acadmico y profesional:

    A mis padres Nicols y Mara del Carmen, quienes con su ejemplo me

    ensearon que todo es posible si uno se propone, sin ellos, jams hubiese podido

    conseguir este objetivo

    A mis hermanos, compaeros de clases y amigos, porque de ellos tambin

    he aprendido.

    Nicols Chavez Espnola

    A mis padres, porque siempre creyeron en m y porque me sacaron

    adelante, dndome ejemplos dignos de superacin y entrega, porque en gran parte

    gracias a ustedes, hoy puedo ver alcanzada m meta.

    A mi familia, por ser soporte fundamental en las etapas complicadas, que

    fueron muchas.

    A mi novia, por comprenderme y apoyarme siempre y en todo momento.

    A mis compaeros de la facultad, que compartieron esta carrera que por

    momentos pareca infinita.

    A todos, espero no defraudarlos y contar siempre con su valioso apoyo,

    sincero e incondicional.

    Todo este trabajo ha sido posible gracias a ellos.

    Christian Bavera

  • AGRADECIMIENTOS

    Primero antes que nada, damos gracias a Dios, por estar con nosotros en

    cada paso que dimos, por fortalecer nuestros corazones e iluminar nuestras mentes

    y haber puesto en nuestro camino a aquellas personas que han sido soporte y

    compaa durante todo el periodo de estudio.

    A nuestros profesores quienes nos han enseado a ser mejores en la vida y

    a realizarnos profesionalmente.

    Un agradecimiento especial a nuestra asesora la Lic. Denise Riveros por

    hacer posible esta tesis.

    A los compaeros de clases quienes nos acompaaron en esta trayectoria

    de aprendizaje y conocimientos.

    Al Grupo Flayp, por permitirnos realizar este proyecto, ponindose a

    nuestra disposicin y brindndonos todas las facilidades desde el primer al ltimo

    da en que as lo requerimos

    En general quisiramos agradecer a todas y cada una de las personas que

    han vivido con nosotros la realizacin de esta tesis.

  • NDICE

    CAPITULO 1 - INTRODUCCIN ..................................................................... 13

    1.1. Planteamiento del Problema ................................................................... 13

    1.2. Necesidad de estudiar el problema. ........................................................ 14

    1.3. Significacin del problema ..................................................................... 14

    1.4. Delimitacin del problema ...................................................................... 14

    1.5. Objetivos de la Tesis: .............................................................................. 15

    1.5.1. Objetivo General ............................................................................. 15

    1.5.2. Objetivos Especficos ...................................................................... 15

    1.6. Definicin de trminos ............................................................................ 16

    1.7. Presentacin del esquema ....................................................................... 17

    CAPITULO 2MARCO TERICO ..................................................................... 19

    2.1. El valor de la informacin....................................................................... 19

    2.2. Necesidad de informacin y conocimiento en la empresa ...................... 20

    2.3. La informacin que las empresas necesitan ............................................ 21

    2.4. Las organizaciones y los distintos sistemas de informacin ................... 24

    2.5. Definicin de Inteligencia de Negocios .................................................. 26

    2.6. Los usuarios de las soluciones de Inteligencia de Negocios................... 27

    2.7. Historia de la Inteligencia de Negocios .................................................. 28

    2.8. Caractersticas de la Inteligencia de Negocios ........................................ 30

    2.9. Componentes de una solucin de Inteligencias de Negocios ................. 31

    2.9.1. Las fuentes de informacin a las que se puede acceder son: .......... 32

    2.9.2. Proceso de extraccin, transformacin y carga ............................... 33

    2.9.3. Data warehouse............................................................................... 35

    2.9.4. Herramientas de acceso de la Inteligencia de Negocios ................. 40

    2.10. Principales herramientas de la Inteligencia de Negocios ........................ 42

    2.11. Minera de datos ...................................................................................... 43

    2.11.1. Conceptos e historia de la minera de datos ................................ 43

    2.11.2. Los fundamentos de la minera de datos. .................................... 45

    2.11.3. Objetivos de la minera de datos ................................................. 45

    2.11.4. Entorno de la minera de datos .................................................... 46

    2.11.5. El alcance de la minera de datos ................................................ 47

    2.12. Resea histrica del Grupo Flayp ........................................................... 47

    2.13. Resea histrica del software libre ......................................................... 50

  • 2.13.1. Richard Stallman y el proyecto GNU .......................................... 50

    2.13.2. Software Libre ............................................................................. 52

    2.13.3. Libertades bsicas del software libre ........................................... 54

    2.13.4. Software libre y software de cdigo abierto ................................ 55

    2.13.5. Tipos de licencias de software libre ............................................. 58

    CAPTULO 3 MARCO METODOLGICO ..................................................... 60

    3.1. Descripcin de la profundidad y el diseo de la Tesis: ........................... 60

    3.2. Descripcin de cmo se realiz la Tesis ................................................. 61

    3.2.1. Relevamiento de datos .................................................................... 62

    3.2.2. Anlisis de datos ............................................................................. 62

    3.2.3. Diseo ............................................................................................. 63

    3.2.4. Desarrollo ........................................................................................ 64

    3.2.5. Prueba .............................................................................................. 65

    3.2.6. Implementacin ............................................................................... 65

    3.3. Descripcin de los instrumentos y procedimientos utilizados para la recoleccin y tratamiento de la informacin ..................................................... 66

    3.4. Descripcin de la muestra ....................................................................... 66

    3.5. Relevamiento .......................................................................................... 67

    3.5.1. Relevamiento de procesos ............................................................... 67

    3.5.2. Relevamiento de Estructura de Datos ............................................. 71

    3.5.3. Relevamiento de Necesidades ......................................................... 71

    3.5.4. Relevamiento tecnologa actual del Grupo Flayp ........................... 72

    3.5.5. Relevamiento Sistemas gestores de Bases de Datos ....................... 72

    3.5.6. Relevamiento algoritmo de minera de datos .................................. 75

    3.5.7. Relevamiento de sistemas operativos ............................................. 78

    3.5.8. Relevamiento de herramientas de Inteligencia de Negocios........... 79

    3.6. Anlisis ................................................................................................... 81

    3.6.1. Anlisis de requerimientos .............................................................. 81

    3.6.2. Anlisis de procesos ........................................................................ 83

    3.6.3. Anlisis de estructura de datos ........................................................ 84

    3.6.4. Anlisis de herramientas de Inteligencia de Negocios .................... 85

    3.6.5. Anlisis de sistemas gestores de bases de datos.............................. 86

    3.6.6. Anlisis de tecnologa actual del Grupo Flayp ............................... 87

    3.6.7. Anlisis de algoritmo de minera de datos ...................................... 87

    3.6.8. Anlisis de sistemas operativos ....................................................... 88

    3.6.9. Anlisis de factibilidad econmica ................................................. 90

  • 3.7. Diseo ..................................................................................................... 91

    3.7.1. Diseo del data warehouse ............................................................. 91

    3.7.2. Diseo del proceso ETL .................................................................. 93

    3.7.3. Diseo de reportes ........................................................................... 98

    3.7.4. Diseo de cubos multidimensionales ............................................ 101

    3.7.5. Diseo de cuadros de mandos ....................................................... 105

    3.7.6. Diagramas casos de uso ................................................................ 107

    3.7.7. Diagrama de actividades ................................................................ 110

    3.7.8. Diagramas de secuencia ................................................................. 112

    3.7.9. Diagrama de arquitectura de Pentaho Open BI Suite ..................... 114

    3.7.10. Arquitectura del prototipo de solucin de Inteligencia de Negocios. 116

    3.8. Desarrollo del prototipo ......................................................................... 117

    3.8.1. Desarrollo del data warehouse ....................................................... 117

    3.8.2. Desarrollo de proceso ETL ............................................................ 118

    3.8.3. Desarrollo de minera de datos ...................................................... 125

    3.8.4. Desarrollo de reportes ................................................................... 127

    3.8.5. Desarrollo de cubos multidimensionales ...................................... 130

    3.8.6. Desarrollo de cuadros de mandos ................................................. 133

    3.9. Prueba de prototipo ............................................................................... 136

    3.10. Implementacin del Prototipo ............................................................... 143

    3.10.1. Implementacin de ETL y Data warehouse .............................. 143

    3.10.2. Implementacin de Pentaho Open BI Server ............................ 144

    3.10.3. Implementacin de consola de administracin de usuarios Pentaho 148

    3.10.4. Implementacin de reportes ...................................................... 150

    3.10.5. Implementacin de los cubos multidimensionales .................... 152

    3.10.6. Implementacin de cuadros de mandos ..................................... 153

    CAPTULO 4 RESULTADOS .......................................................................... 154

    CAPTULO 5 - CONCLUSIONES ................................................................... 155

    CAPTULO 6- RECOMENDACIONES ........................................................... 156

    BIBLIOGRAFA ................................................................................................ 157

    ANEXOS ............................................................................................................ 159

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 8

    LISTA DE TABLAS

    Tabla 1: Diferencias entre sistemas OLTP y OLAP. ............................................. 39

    Tabla 2: Infraestructura actual de las empresas. .................................................... 72

    Tabla 3: Datos de ejemplo ..................................................................................... 77

    Tabla 4: Descripcin del algoritmo backpropagation ........................................... 77

    Tabla 5: Comparativa herramientas de Inteligencia de Negocios ......................... 85

    Tabla 6: Comparativa de SGBD ............................................................................ 86

    Tabla 7: Comparativa de algoritmos de minera de datos. .................................... 88

    Tabla 8: Comparativa de sistemas operativos ....................................................... 89

    Tabla 9: Cuadro de costos ..................................................................................... 90

    Tabla 10: Mapeo de tabla inter_articulos_viru ...................................................... 94

    Tabla 11: Mapeo de tabla dw_articulos ................................................................. 94

    Tabla 12: Mapeo de tabla dw_clientes .................................................................. 94

    Tabla 13: Mapeo de tabla dw_campaas_actuales ................................................ 94

    Tabla 14: Mapeo de tabla clonado_dbf_viru ......................................................... 95

    Tabla 15: Mapeo de tabla inter_pedido_avon ....................................................... 96

    Tabla 16: Mapeo de tabla inter_pedido_viru ........................................................ 96

    Tabla 17: Mapeo de tabla inter_ventas_avon ........................................................ 96

    Tabla 18: Mapeo de tabla inter_ventas_viru ......................................................... 97

    Tabla 19: Mapeo de tabla dw_hechosventas ......................................................... 97

    Tabla 20: Mapeo de tabla dw_hechospedidos ....................................................... 98

    Tabla 21: Anlisis cubo ventas por campaa, divisin, categora y empresa. .... 104

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 9

    LISTA DE FIGURAS

    Figura 1: Pirmide de usuarios de un sistema de Inteligencia de Negocios ......... 28

    Figura 2: Componentes de Inteligencia de Negocios ............................................ 31

    Figura 3: Fuentes de informacin. ........................................................................ 33

    Figura 4: Data warehouse ..................................................................................... 36

    Figura 5: Data marts ............................................................................................. 38

    Figura 6: Herramientas de acceso. ........................................................................ 40

    Figura 7: DER Hechos Pedidos............................................................................. 92

    Figura 8: DER Hechos Ventas. .............................................................................. 93

    Figura 9: DER Proyeccin .................................................................................... 93

    Figura 10: Ventas por campaas por zonas ........................................................... 99

    Figura 11: Reporte proyeccin de ventas ............................................................ 100

    Figura 12: Dimensin artculos ........................................................................... 101

    Figura 13: Dimensin campaa .......................................................................... 102

    Figura 14: Dimensin clientes ............................................................................ 102

    Figura 15: Dimensin campaa .......................................................................... 103

    Figura 16: Hechos pedidos .................................................................................. 103

    Figura 17: Hechos Ventas .................................................................................... 103

    Figura 18: Estructura del cuadro de mando ........................................................ 105

    Figura 19: Arquitectura lgica del cuadro de mando .......................................... 106

    Figura 20: Caso de uso usuario ........................................................................... 107

    Figura 21: Caso de uso administrador-consola ................................................... 108

    Figura 22: Caso de uso administrador servidor ............................................... 108

    Figura 23: Caso de uso administrador informes .............................................. 109

    Figura 24: Diagrama de Actividades usuario ....................................................... 110

    Figura 25: Diagrama de actividades administrador - usuarios ............................. 111

    Figura 26: Diagrama de actividades administrador - servidor ............................. 111

    Figura 27: Diagrama de actividades administrador informes ........................... 112

    Figura 28: Diagrama de secuencia consulta de reporte y cubo ......................... 113

    Figura 29: Diagrama de secuencia crear usuario ................................................. 113

    Figura 30: Diagrama de secuencia administrar prototipo .................................... 114

    Figura 31: Arquitectura Pentaho Open BI Suite .................................................. 115

    Figura 32: Arquitectura de Inteligencia de Negocios ........................................... 117

    Figura 33: Data warehouse en PhpMyAdmin ..................................................... 118

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 10

    Figura 34: Transformacin seleccin de campaa a cargar ................................. 119

    Figura 35: Transformacin inter_ventas_viru ..................................................... 120

    Figura 36: Transformacin limpieza de clonado_dbf_viru ................................. 120

    Figura 37: Transformacin borrado hechos_ventas viru ..................................... 121

    Figura 38: Transformacin cargado de tabla hechos_ventas_viru ...................... 121

    Figura 39: Trabajo general de cargado dw_hechosventas fuente Viru ................ 122

    Figura 40: Transformacin cargado de tabla inter_ventas_avon ........................ 123

    Figura 41: Transformacin borrado dw_hechosventas ....................................... 123

    Figura 42: Transformacin cargado dw_hechosventas ....................................... 124

    Figura 43: Trabajo general de cargado hechos_ventas Fuente Flayp ................. 125

    Figura 44: Desarrollo reporte ventas por campaas por zonas ........................... 129

    Figura 45: Reporte de proyeccin de ventas ....................................................... 130

    Figura 46: Estructura de los cubos ...................................................................... 131

    Figura 47: Capas de CDE .................................................................................... 134

    Figura 48: Definicin de estructura..................................................................... 134

    Figura 49: Estructura de CDM ............................................................................ 135

    Figura 50: Origen de datos .................................................................................. 135

    Figura 51: Seleccin de archivos dbf Vir. ......................................................... 137

    Figura 52: Cargado de tabla intermedia inter_ventas_viru ................................. 138

    Figura 53: Borrado de dw_hechosventas ............................................................ 138

    Figura 54: Cargado de dw_hechosventas ............................................................ 139

    Figura 55: Trabajo hechos ventas fuente dbf ...................................................... 140

    Figura 56: Cargado de la tabla inter_ventas_avon .............................................. 141

    Figura 57: Borrado hechos ventas Flayp S.R.L. ................................................. 141

    Figura 58: Hechos ventas fuente MySQL ........................................................... 142

    Figura 59: Trabajo hechos ventas fuente MySQL............................................... 143

    Figura 60: Descarga de Bussines Intelligence Server ......................................... 145

    Figura 61: Inicio del servicio Apache. ................................................................ 146

    Figura 62: Instalacin de Pentaho Bussines Intelligence Server. ........................ 146

    Figura 63: Pantalla de inicio de sesin en la consola de usuario de Pentaho...... 147

    Figura 64: Consola de usuario Pentaho ............................................................... 147

    Figura 65: Consola de administracin de usuarios ............................................. 149

    Figura 66: Administracin de fuentes de datos ................................................... 150

    Figura 67: Publicacin del reporte ventas por campaa por zonas ..................... 151

    Figura 68: Publicacin reporte de ventas por zonas............................................ 151

    Figura 69: Cubo de ventas .................................................................................. 152

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 11

    Figura 70: Participacin en facturacin por empresas ........................................ 153

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 12

    LISTA DE SMBOLOS O ABREVIATURAS

    OLTP:Online Transaction Processing

    OLAP:On-Line Analytical Processing

    ETL:Estract, Transform and Load

    ERP:Enterprise Resource Planning

    CRM:Customer Relationship Management

    KDD:Knowledge Discovery in Databases

    VPN:Virtual Private Network

    GNU:GNU is Not Unix

    FSF:Free Software Foundation

    GPL:General Public Licence

    OSI:Open Source Initiative

    PDI: Pentaho Data Integration

    SGBD: Sistema Gestor de Base de Datos

    TI: Tecnologa de Informacin

    DDL:Data Definition Language

    DML: Data Manipulation Language

    TCT/IP: Transmission Control Protocol Internet Protocol

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 13

    CAPITULO 1 - INTRODUCCIN

    1.1. Planteamiento del Problema

    El Grupo Flayp est compuesto por varias empresas, cada una de

    ellas cuenta con diferentes sistemas de informacin para realizar sus

    procesos de negocio, las mismas generan y almacenaninformacinen

    distintos formatos y en gran volumen.

    Con toda esta acumulacin de informacin diversificada,resulta

    dificultoso para los gerentes tener una imagen precisa de la informacin

    ms importante para las empresas del Grupo y ms an para el directorio,

    quien tiene a su cargo la direccin general Grupo.

    A esto debemos sumarle, que ninguna de las empresas cuenta con

    un sistema generador automtico de informes, y que los mismos son

    preparados sobre pedido, con todo lo que esto implica.

    El reto de este proyecto consiste en brindar un prototipo de

    solucin de Inteligencia de Negocios capaz de transformar los datos en

    informacin til, de manera que los gerentes y directores puedan utilizar

    dicha informacin para incrementar la rentabilidad de las empresas.

    Brindndoles un soporte en el cual respaldar la toma de decisiones

    estratgicas.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 14

    1.2. Necesidad de estudiar el problema.

    El hecho de tener una gran cantidad de datos acumulados, no

    representa necesariamente tener una gran cantidad de informacin, y que

    dicha informacin sea o no relevante para la empresa, depende en gran

    medida de la forma y calidad en la que esta llegue a los tomadores de

    decisiones, la Inteligencia de Negocios tiene como uno de sus ejes

    principales lograr esto, ayudar a comprender mejor el comportamiento de

    la empresa, esto da pie para para realizar un estudio e implementar

    soluciones, haciendo uso de herramientas tecnolgicas actuales, siguiendo

    tendencias y estndares en las reas de la informtica.

    1.3. Significacin del problema

    La importancia de este proyecto radica en lograr la implementacin

    de un prototipo de solucin de Inteligencia de Negocios que sea capaz de

    unificar los datos que se encuentran en distintos formatos, provenientes de

    las dos empresas Flayp S.R.L. y Vir S.R.L., pertenecientes al Grupo

    Flayp y lograr entre otras cosas, brindar informacin cohesionada, fiable y

    til.

    1.4. Delimitacin del problema

    La presente tesis se limita al desarrollo de un prototipo de solucin

    de Inteligencia de Negocios para los departamentos de Ventas y Marketing

    de las empresas Flayp S.R.L. y Vir S.R.L., integrantes del Grupo Flayp,

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 15

    en funcin a los requerimientos de informacin solicitadas por dichas reas

    para los procesos de ventas y pedidos.

    En cuanto a los datos si bien en un principio se pretenda acceder a

    toda la informacin del Grupo Flayp, las personas a cargo accedieron a

    prestar los datos de forma parcial, haciendo nfasis en la importancia de

    mantener la confidencialidad de los mismos y que fueran utilizados

    exclusivamente para fines acadmicos.

    1.5. Objetivos de la Tesis:

    1.5.1. Objetivo General

    Implementar un prototipo de Sistema de Inteligencia de

    Negocios usando Minera de Datos sobre Software Libre.

    1.5.2. Objetivos Especficos

    a) Relevar todos los procesos administrativos y de negocio

    de las empresas.

    b) Relevar software, hardware y tipos de informes.

    c) Analizar software, hardware y tipos de informes.

    d) Definir los tipos de informes de acuerdo al perfil y las

    necesidades de cada usuario.

    e) Disear, desarrollar, probar e implementar prototipo de

    solucin de Inteligencia de Negocios.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 16

    f) Documentar ciclo de vida del prototipo de solucin de

    Inteligencia de Negocios.

    g) Realizar la demostracin del funcionamiento del prototipo.

    1.6. Definicin de trminos

    Servidor:Mquina conectada a Internet que entre otros servicios ofrece

    alojamiento para pginas web haciendo que estn accesibles desde

    cualquier punto de Internet.

    Data Warehouse: Coleccin de datos orientado a un mbito determinado

    (empresa, organizacin, etc.) sus caractersticas son no voltil, integrado y

    variable en el tiempo.

    Data Marts: Es una versin especial de data warehouse, son subconjuntos

    de datos con la finalidad de ayudar a la toma de decisiones dentro de un

    rea especfica en la organizacin.

    Minera de Datos:La integracin de un conjunto de reas que tienen como

    propsito la identificacin de un conocimiento obtenido a partir de las

    bases de datos que aporten una gua para la toma de decisiones.

    Inteligencia de Negocios:Es unconjunto de tecnologas que tienen un fin

    comn con el principal objetivo que es la de servir como soporte para la

    toma de decisiones.

    Cuadros de Mando:Es una herramienta de gestin que facilita la toma de

    decisiones, recoge un conjunto coherente de indicadores que proporciona a

    los niveles gerenciales una visin comprensible del negocio de manera

    grfica.

    Software Libre: se refiere al tipo de licencias de software que garantiza la

    libertad de los usuarios para ejecutar, copiar, distribuir, estudiar, cambiar y

    mejorar el software.

    Open Source: Es el termino con el que se conoce al software distribuido y

    desarrollado libremente.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 17

    Consultas Adhoc:Se refiere a las consultas elaboradas especficamente

    para un fin preciso y por lo tantono generalizable ni utilizable para otros

    propsitos.

    Copyleft: Es un mtodo general para hacer un programa o software libre,

    exigiendo que todas las versiones modificadas y extendidas del mismo

    sean tambin libres.

    1.7. Presentacin del esquema

    En el Captulo I Introduccin:se presenta el contenido de la tesis, la

    definicin del problema de la investigacin, la justificacin de la necesidad

    del estudio y los objetivos.

    En el Captulo II - Marco Terico: en este captulo se realiza una

    descripcin de la importancia y el valor de la informacin en las empresas,

    y el concepto de la Inteligencia de Negocios, donde se mencionan sus

    principales componentes como lo son el data warehouse,On-Line

    Analytical Processing (en adelante OLAP), Extract, Transform and Load

    (en adelante ETL) y minera de datos, adems se muestran los principios

    claves de estas tecnologas, tambin se hace referencia al concepto de

    software libre y por ltimo se presenta al Grupo Flayp, ya que es este el

    lugar elegidopara llevar adelante este trabajo de grado, todas estas

    secciones son para una mejor comprensin de lo que se pretende lograr

    con este proyecto.

    En el Captulo III - Marco Metodolgico:se trata sobre la metodologa

    utilizada en este trabajo, tipo de investigacin y los detalles de la

    realizacin. El mismo se encuentra dividido en 6 partes. En la primera se

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 18

    describen los mtodos utilizados para el relevamiento de los

    requerimientos, datos, procesos, tecnologa y herramientas. En la segunda

    parte se analizan los datos relevados seleccionando los inherentes al

    proyecto, tambin se analiza el modelo de datos de los sistemas actuales, y

    se seleccionan aquellos que sern utilizados para el modelado de datos del

    datawarehouse, adems se realiza una comparacin entre las diferentes

    opciones de herramientas de inteligencia de negocios. En la tercera se

    realizan los diseos deldata warehouse, los procesos de ETL, los distintos

    tipos de informes y los diagramas necesarios para la realizacin del

    proyecto. En la cuarta parte se desarrolla el prototipo. En la quinta se

    realizan las pruebas del prototipo. En la sexta y ltima etapa se realiza la

    implementacin del prototipo.

    En el Captulo IV Resultados: se describen los resultadosobtenidos,

    demostrando la factibilidad de la implementacin de un prototipo de

    solucin de Inteligencia de Negocios sin incurrir en gastos en cuanto a

    licencias de software.

    En el Captulo V Conclusiones:se presenta la sntesis de los objetivos y

    la conclusin del trabajo.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 19

    CAPITULO 2MARCO TERICO

    2.1. El valor de la informacin

    En la actualidad, cuya caracterstica ms importante, se basa en un

    crecimiento a gran escala de las tecnologas de la informacin y las

    telecomunicaciones, los activos ms valiosos de una empresa pasan a ser

    los conocimientos, habilidades, valores y actitudes de sus empleados.

    Partiendo de la premisa de que el conocimiento sobre un tema

    determinado y su optima utilizacin, se convierte en un factor

    determinante para el xito en el mundo empresarial. El capital intelectual

    ha desplazado a los factores tradicionales, como ser la produccin, el

    capital, la tierra oel trabajo, como principal elemento a la hora de generar

    valor econmico para la empresa, tal como se desprende del planteamiento

    de Cohen y Asn (2.000).

    Todas las compaas de alguna manera han adoptado un modelo del

    mundo de negocios sustentado en la informacin, como por ejemplo: qu

    factores influyen en la compra y la demanda?, cmo hallar las

    oportunidades de negocio?, existe directa relacin entre la calidad del

    producto y la demanda de los clientes? A medida que la exactitud de esta

    informacin crece, la capacidad de la empresa por competir se incrementa

    en forma proporcional.

    La informacin puede transformarse en conocimiento tcito o

    explcito. Se entiende por conocimiento tcito aquel que poseen las

    personas producto de la experiencia adquirida, los estudios y la educacin;

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 20

    mientras que los conocimientos explcitos son aquellos almacenados en

    bases de datos. Un ejemplo claro es aquel que se produce cuando una

    persona cambia de empleo, esta se est llevando consigo informacin,

    conocimientos y est ofertando su capacidad intelectual por un mayor

    precio; en el mbito laboral, la experiencia y la educacin son factores

    claves para aumentar el costo de la fuerza del trabajo intelectual. As

    mismo, el hecho de que un sistema que maneja informacin,

    eventualmente falle, indefectiblemente generar prdidas a la empresa.

    Es una clara tendencia que las empresas estn apostando

    fuertemente por la tecnologa y las personas, para que en conjunto tengan

    un conocimiento suficiente que logre acercar la visin interna de ambos a

    la realidad exterior, en la misma medida que la brecha entre la visin

    interna y la realidad exterior disminuye, se consigue tomar decisiones ms

    acertadas y en menos tiempo. Lo que busca esta tendencia es acercar lo

    mximo posible el mundo real a la visin interna para generar mayores

    ganancias, convirtiendo la informacin en utilidad y darle un valor a la

    informacin.

    2.2. Necesidad de informacin y conocimiento en la empresa

    Desde el mismo instante en que las empresas iniciaron el proceso

    de acumular los datos de sus operaciones en medios de almacenamiento

    fsico, y de esa forma conseguir una mejor administracin y control de

    dicha informacin, ha surgido la necesidad de utilizarla para entender las

    necesidades particulares del negocio. En un mercado altamente

    competitivo, donde muchas marcas ofrecen productos similares, los

    clientes tienen una amplia gama de posibilidades para la eleccin del

    producto. Para obtener una porcin del mercado, es indispensable para las

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 21

    empresas, tener la suficiente capacidad de transformar la informacin

    acumulada en conocimiento.

    La necesidad de informacin en las empresas no surge de un da

    para el otro, el propsito de almacenar los datos radica en su utilizacin en

    algn momento, cuando as se requiera, caso contrario, cualquier dato de

    control sera desechado instantneamente. Lo que si surge sbitamente, es

    la imperiosa necesidad de dar respuesta rpida a los requerimientos de

    informacin para la toma de decisiones y ayudar a mejorar de alguna

    manera los procesos internos de negocio.

    2.3. La informacin que las empresas necesitan

    En la actualidad las organizaciones demandan informacin en los

    niveles donde anteriormente la administracin se basaba meramente en la

    intuicin y el sentido comn para la toma de decisiones. Los mercados

    dinmicos obligan a las empresas a que la informacin estratgica est

    disponible en las computadoras de los directivos y/o gerentes, esta prctica

    se ha generalizado principalmente motivada por la mayor utilidad que se

    obtiene de la informacin compartida.

    Hoy en da la informacin est presente en todos los niveles de la

    organizacin con propsitos diferentes (comunicacin, control,

    administracin, evaluacin, etc.) ayudando a la correcta y oportuna toma

    de decisiones desde el nivel gerencial, hasta el nivel operativo de la

    organizacin. Las empresas han entendido que a pesar de que los niveles

    directivos tienen una gran responsabilidad al tomar decisiones, por el peso

    que conllevan las mismas, existen tambin personas que toman decisiones

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 22

    y a pesar de que stas no tienen un impacto global, deben ser de igual

    manera correctas y oportunas.

    Directores, gerentes, jefes y todos aquellos que toman decisiones

    deben contar con la suficiente informacin para respaldar su trabajo

    cotidiano, la posicin que ocupen en la pirmide organizacional se torna

    secundaria cuando la mirada es hacia la gestin de los procesos y como as

    tambin los puestos que tienen cierta relacin y dependencia entre s.

    De modo general en una pirmide organizacional, los

    requerimientos informativos se dividen en tres niveles:

    Informacin Estratgica

    Informacin Tctica

    Informacin Tcnico Operacional.

    Informacin Estratgica: est pensada principalmente para ayudar a la

    toma de decisiones de las reas gerenciales para alcanzar la misin

    empresarial. Se caracteriza porque son sistemas con poca carga diaria de

    trabajo y sin una gran cantidad de datos, sin embargo, la informacin que

    guarda est relacionada a un contexto cualitativo ms que cuantitativo, que

    puede indicar cmo evolucionar en el futuro, el criterio es distinto, pero

    sobre todo es distinta su delimitacin. Se asocia esta informacin a los

    niveles ejecutivos de las empresas. Es importante sealar que la

    informacin estratgica se nutre de grandes cantidades de datos de reas

    relacionadas y no se enfoca puntualmente en una sola direccin, de ah que

    las decisiones que puedan ser tomadas tienen un impacto directo en toda la

    organizacin.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 23

    Informacin Tctica: este tipo de informacin es la que soporta la

    coordinacin de actividades y el nivel operativo de la estrategia, es decir,

    se analizan opciones y se trazan rutas posibles para alcanzar la estrategia

    definida por la direccin de la empresa. Se facilita la gestin independiente

    de la informacin por parte de los niveles intermedios de la organizacin.

    Este tipo de informacin es extrada puntualmente de un rea o seccin de

    la organizacin, por lo que su alcance es local y se asocia habitualmente a

    las gerencias.

    Informacin Tcnico Operacional: hace referencia a las operaciones

    diarias que son efectuadas de modo rutinario en las corporaciones

    mediante la transaccin masiva de datos y sistemas transaccionales. Las

    cargas son cotidianas y soportan la actividad de la empresa da tras da

    (contabilidad, facturacin, almacn, presupuesto, etc.). Generalmente se

    asocia esta informacin con los jefes de rea o las coordinaciones

    operativas, tambin llamadas de tercer nivel.

    Podemos considerar entonces factores internos y externos de una

    empresa y as concluir que los requerimientos en la actualidad se orientan

    a descubrir y mejorar los beneficios de toda la cadena corporativa. Dichos

    requerimientos se ven reflejados en el inters por tener a mano los

    indicadores que arrojen informacin concreta y clave para determinada

    rea de la empresa, y en el menor tiempo posible. La clara tendencia es

    que las reas gerenciales necesitan en su mesa de trabajo, la informacin

    clave de su empresa; en todos los niveles el requerimiento es parecido,

    aunque es evidente que tendr objetivos diferentes.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 24

    2.4. Las organizaciones y los distintos sistemas de informacin

    Para que una empresa est completamente automatizada es

    necesario contar con una gran infraestructura en tecnologas para que

    soporte todos los sistemas de informacin. El crecimiento en tecnologa

    puede tener distintos orgenes partiendo desde la implementacin,

    crecimiento, ampliacin, mantenimiento, etc. Las necesidades actuales de

    las empresas han provocado contar con tecnologa de la informaciones ms

    sofisticados para responder a cada una de sus peticiones de informacin,

    esto impuls a que las compaas adquieran distintos tipos de sistemas de

    informaciones, entre estos sistemas podemos mencionar a los OnLine

    Transaction Processing(en adelante OLTP), Planificacin de Recursos

    Empresariales(en adelante ERP), Sistemas de Soporte para la toma de

    decisiones (en adelante DSS), Administracin de la Relacin con Clientes

    (en adelante CRM), etc.

    Estos sistemas siempre estn utilizando bases de datos para

    almacenar la informacin generada, las mismas se utilizan como soporte

    para la toma de decisiones en las empresas.

    Existen empresas que precisan informacin de una actividad

    especfica, un ejemplo seria los Sistemas ERP (Planificacin de Recursos

    Empresariales) son sistemas muy complejos y grandes donde un alto

    porcentaje de su contenido dedica a los procesos de produccin, si una

    empresa se dedica a las bienes races, sera ilgico adquirir un sistema de

    alta complejidad y costoso como las ERP que no va a dar una solucin a

    las necesidades de la empresa. Para empresas como estas, existen

    desarrollos de soluciones en el mercado comercializado como productos

    que pueden ser configurados en una organizacin en particular de acuerdo

    a sus necesidades, que dan soluciones a requerimientos especficos para

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 25

    cada industria. Hay en el mercado, software para distintos tipos de

    empresas como automotriz, hotelera, comercios, educativos entre otros.

    Son distintas las herramientas utilizadas debido a que las

    actividades de misin crtica que soportan cada una de las organizaciones

    son diferentes, y por ende tambin son distintos los tipos de informacin

    que puede solicitar un directivo en cada una de las organizaciones, lo cual

    justifica que existan muchos productos de software dedicados a explotar la

    informacin de las bases de datos que no tienen caractersticas estndares,

    sino ms bien son adaptables segn las exigencias. Considerando las

    necesidades que se presentan en cada actividad.

    La informacin que se genera en una empresa u organizacin est

    destinada a responder a diversos tipos de preguntas de los usuarios, de ah

    nace la necesidad que existan sistemas de informacin para requerimientos

    muy especficos que permitan la recoleccin y el manejo de los datos. La

    estructura organizacional de una empresa es un factor importante para

    determinar la informacin que comnmente es requerida por los

    funcionarios.

    Los sistemas de procesamiento de datos (OLTP) utilizan medios de

    almacenamiento y tcnicas para el cargado. Un alto porcentaje de las

    empresas recurren a los OLTP para guardar grandes cantidades de datos

    con un tiempo de respuesta corto en los miles de transacciones realizadas

    cotidianamente, sin embargo, su eficiencia no son las consultas masivas de

    grandes cantidades de informacin y mucho menos el anlisis de la misma.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 26

    La tecnologa tuvo que adaptar los medios necesarios para que sean

    eficientes en el mbito especfico de aplicacin, as como para el diseo de

    estructuras de datos que ordenen la informacin como se desea, como en

    las herramientas o software que dan soluciones oportunas a los usuarios.

    Todos los sistemas de informacin tienen un fin muy particular, y se

    complementan para mantener de la manera ms eficiente una organizacin;

    sin embargo, no todos pueden dar solucin a las distintas demandas de los

    usuarios, ya que son diseados para alguna rea especfica.

    El motivo por el cual existen diferentes sistemas de informacin es

    porque las preguntas de los usuarios son muy especficas que no cualquier

    sistema puede resolver. De hecho la base de datos operacional, que es

    imprescindible en cualquier organizacin pero no est organizada para dar

    respuestas a preguntas globales sino ms bien a pequeos grupos de datos.

    Preguntas que impliquen consultas complejas podran resolverse en un

    lapso muy extenso, donde la posibilidad de que la vigencia desaparezca

    aumenta considerablemente. Es importante recalcar que una base de datos

    o sistema de informacin no est diseada para resolver las necesidades

    informativas de la organizacin a nivel macro.

    2.5. Definicin de Inteligencia de Negocios

    La Inteligencia de Negocios cuenta con una diversidad de

    interpretaciones como muchos otros trminos o conceptos. Su uso es

    justificado a todo lo que sea considerado como tecnologa de informacin,

    pero no hay un consenso en lo respecta a su definicin.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 27

    [] es el conjunto de tecnologas que permiten a las empresas

    utilizar la informacin disponible en cualquier parte de la organizacin

    para hacer mejores anlisis, descubrir nuevas oportunidades y tomar

    decisiones ms informadas(HOWARD DRESNER, H 1.989).

    Examinando las distintas definiciones queda claro que la

    Inteligencia de Negocios no consiste en una metodologa, sistema,

    software o herramienta en particular, si no es un conjunto de tecnologas

    que tienen un fin comn con el principal objetivo que es la de servir como

    soporte para la toma de decisiones.

    2.6. Los usuarios de las soluciones de Inteligencia de Negocios

    A continuacin se describen los diferentes tipos de usuarios que

    intervienen en una solucin de inteligencia de negocios.

    Productores de informacin:[..]Habitualmente son el 20% de

    los usuarios, que crean informes o modelos utilizando herramientas de

    escritorio. Donde predominan estadsticos que se valen de herramientas

    para minera de datos o son creadores de informes que utilizan

    herramientas para el diseo y/o programacin de informes especficos.

    Regularmente son profesionales del rea de sistema de informacin o

    usuarios muy avanzados con capacidades de comprender la informacin

    y la informtica(CANO, J 2.007).

    Los consumidores de informacin: [] Son usuarios no

    habituales que regularmente consultan informes para la toma de

    decisiones, pero no acceden a los nmeros o hacen anlisis detallados

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 28

    diariamente. Los usuarios no habituales son directivos, gestores,

    responsables, colaboradores y usuarios externos. Este numeroso grupo

    est bien servido con cuadros de mando con anlisis guiados, informes

    interactivos (por ejemplo: OLAP, informes parametrizados,

    vinculados,) e informes de gestin estandarizados. La mayora de estas

    herramientas proveen ahora acceso va web para promover el acceso

    desde cualquier lugar y facilitar el uso y minimizar los costes de

    administracin y mantenimiento(CANO, J 2.007).

    En la Figura 1 se puede apreciar a travs de una pirmide los

    distintos niveles de usuarios en una solucin de inteligencias de negocios.

    Figura 1: Pirmide de usuarios de un sistema de Inteligencia de

    Negocios

    2.7. Historia de la Inteligencia de Negocios

    En octubre de 1.958 H.P. Luhn de IBM, escribi un artculo

    llamado Business Intelligence System donde describe las caractersticas

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 29

    que debe tener un sistema de este tipo, en muchos aspectos de lo que

    escribi Luhn tiempo atrs, si se realiza un paralelismo de lo que se

    entiende hoy en da por inteligencia de negocios no vari mucho.

    Edgar Frank Codd presenta el concepto de las bases de datos en el

    ao 1.969, un ao ms tarde se desarrollaron las primeras base de datos

    con sus interfaz empresariales, estas aplicaciones, facilitan la entrada de

    datos en los sistemas, haciendo que aumente la informacin disponible,

    pero como el acceso a la informacin era de alta complejidad y difcil de

    acceder a las mismas no fue una solucin completa. Otro de los avances

    llegaron en el ao 1.980 con la creacin del concepto del data warehouse

    por Ralph Kimball y Bill Inmon, con ellas aparecieron los primeros

    sistemas de reportes, con todo esto la solucin segua siendo compleja y

    funcionalmente pobre, se contaba con potentes sistemas de bases de datos

    pero no existan aplicaciones que facilitaran su explotacin.

    En 1.989 Howard Dresner difundi el trmino de Business

    Intelligence escrito por H.P. Luhn en el ao 1.958, en la dcada de los 90

    llegaba la Business Intelligence1.0 y con ello la multiplicacin de

    aplicaciones de Inteligencia de Negocios, logrando facilitar el acceso a la

    informacin considerablemente pero empeoraron el problema que se

    quera resolver ya que seguan apareciendo mltiples soluciones sin poder

    consolidarse. Con la llegada de Business Intelligence 2.0 en el ao 2.000

    se logr consolidar las aplicaciones en una pocas plataformas a partir de

    ah las herramientas empezaron a dar soluciones reales a las empresas u

    organizaciones.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 30

    2.8. Caractersticas de la Inteligencia de Negocios

    Informacin: el propsito de la Inteligencia de Negocios es

    proveer de informacin al usuario final para dar soporte a la toma

    decisiones, por ende la informacin es la esencia de la Inteligencia de

    Negocios, estas pueden originarse desde las bases de datos operacionales,

    como tambin de arquitecturas data mart y data warehouse diseadas

    especficamente para el anlisis.

    El usuario requiere de informacin para apoyarse en el momento de

    tomar decisiones, pasando en segundo plano de dnde provenga esta,

    pudiendo ser de una fuente primitiva o derivada, para lo cual la

    inteligencia de negocios utiliza o crea fuentes de datos interna o externa

    con el fin de utilizarla como materia prima para lograr su objetivo.

    Apoyo a la toma de decisiones: bsicamente consiste en organizar

    y presentar los datos relevantes para que sirvan como soporte a la hora de

    tomar decisiones. Esto implica la utilizacin de tecnologas, tcnicas de

    anlisis y todo lo que sea necesario con el fin de obtener solamente aquella

    informacin relevante y til.

    Orientacin al usuario final:un factor fundamentalque tuvo su

    incidencia en la tecnologa de la Inteligencia de Negocios para explotar

    informacin, fue que el usuario final no contaba con conocimientos y

    tcnicas que le permita acceder de una manera sencilla y directa a los datos

    almacenados en los sistemas operacionales, ya que casi siempre necesitaba

    de ayuda de informticos para acceder a la informacin, con la Inteligencia

    de Negocios, se elimina la dependencia de terceras personas para el acceso

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 31

    a los datos e informacin, siendo esta una herramienta sencilla y preparada

    para que interacte directamente con el usuario final sin intermediarios.

    2.9. Componentes de una solucin de Inteligencias de Negocios

    Teniendo en cuenta el esquema mencionado por Cano (2.007) la

    solucin de Inteligencia de Negocios est compuesta por las fuentes de

    informacin, proceso de ETL (extraccin, transformacin y limpieza de

    datos) datawarehouse y motor OLAP como se puede apreciar en la figura

    2.

    Figura 2: Componentes de Inteligencia de Negocios

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 32

    Los componentes son:

    Fuentes de informacin: generalmente son los datos generados por

    sistemas operacionales, los cuales se utilizan para alimentar de

    informacin el data warehouse.

    Proceso ETL: de extraccin, transformacin y carga de los datos en

    el datawarehouse. Los datos antes de almacenarse en un data

    warehouse,pasan por procesos de filtrado, limpieza, trasformacin

    y redefinicin.

    El datawarehouse: en l se almacenan los datos de una manera que

    optimice su flexibilidad, facilidad de acceso y administracin, en

    donde los datos estn estructurados para generar informes que

    ayuden a la toma decisiones.

    El motor OLAP: es el que proporciona la capacidad de realizar

    clculos, anlisis, pronsticos, consultas en grandes volmenes de

    datos.

    2.9.1. Las fuentes de informacin a las que se puede acceder son:

    a) Los sistemas operacionales, que contienen las aplicaciones

    desarrolladas a medida.

    b) Sistemas de informacin por sector: presupuestos, hojas

    de clculo, etctera o fuentes de informacin externa,

    compradas a terceros como por ejemplo el estudio del

    mercado.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 33

    En la figura 3 se aprecian las distintas fuentes de

    informacin en un sistema de Inteligencia de Negocios.

    Figura 3: Fuentes de informacin.

    2.9.2. Proceso de extraccin, transformacin y carga

    El proceso de extraccin, transformacin y carga, tambin

    denominado simplemente ETL, es el proceso que permite realizar

    el cargado y actualizacin de los datos obtenidos desde las

    distintas fuentes de informacin en el datawarehouse,

    habitualmente consume entre el 60% y el 80% de recursos en un

    proyecto de Inteligencia de Negociostal como lo indica Ralf

    Kimball (2.004), por lo que es un proceso clave en la vida de todo

    proyecto de esta naturaleza.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 34

    Esta etapa del proceso de construccin del datawarehouse,

    es costosa e implica una inversin significativa de tiempo y

    esfuerzo, para la concrecin de la misma, por ello requiere

    recursos, estrategia, habilidades especializadas y tecnologas.

    La extraccin, transformacin y carga es necesaria para

    acceder a los datos de las fuentes transaccionales de informacin

    y volcarlas al data warehouse. El proceso ETL se divide en cinco

    subprocesos:

    Extraccin: en este proceso se recuperan los datos

    fsicamente de las distintas fuentes de informacin

    transaccional. En este momento se dispone de los datos en

    bruto.

    Limpieza: a travs de este proceso se recuperan los datos

    en bruto y se comprueba su calidad, aqu se eliminan los

    datos duplicados y, de ser posible, se corrigen los valores

    errneos, y completa los valores vacos, es decir se

    transforman los datos, siempre que esto sea posible, para

    reducir al mnimo los errores de carga. En este momento

    se dispone de datos limpios y de alta calidad.

    Transformacin: este proceso utiliza los datos limpios y de

    alta calidad obtenidos en la etapa anterior y los estructura

    en los distintos modelos de anlisis. Como resultado de

    este proceso se obtienen datos limpios, consistentes y

    tiles.

    Integracin: en este proceso se validan los datos cargados

    en el data warehouse, se analiza si son congruentes con

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 35

    las definiciones y formatos del data warehouse; es aqu

    donde se integran en los distintos modelos, de las distintas

    reas de negocio que se han definido en el mismo. Estos

    procesos pueden ser complejos.

    Actualizacin: este es el proceso que permite aadir los

    nuevos datos al data warehouse, como as tambin

    mantener el mismo siempre actualizado.

    2.9.3. Data warehouse

    Eldata warehouse o almacn de datos, es la herramienta

    que surgi como respuesta a las necesidades de los usuarios de los

    niveles gerenciales, que necesitan informacin consistente,

    integrada, histrica y preparada para ser analizada y utilizada para

    mejorar la toma de decisiones.

    Su ubicacin en el contexto de una solucin de

    Inteligencia de Negocios se puede apreciar en la seccin resaltada

    de la figura 4.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 36

    Figura 4: Data warehouse

    El hecho de recuperar la informacin desde los distintos

    sistemas que posea la empresa, sean estos transaccionales o

    externos, para luego almacenarlos en un entorno cohesionado de

    informacin, como es un data warehouse, permitir analizar la

    informacin contextualmente y relacionada dentro de la

    organizacin.

    Las caractersticas que debe cumplir undata warehouse

    son:

    Temtico.

    Integrado.

    Histrico.

    No voltil.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 37

    El proceso de diseo y construccin de un data warehouse

    corporativo usualmente resulta costoso, adems de requerir plazos

    de tiempo que las empresas no estn dispuestas a aceptar. Estas

    situaciones, fueron las que originaron la aparicin de los data

    mart. Los data mart estn enfocados a un grupo particular de

    usuarios dentro de la organizacin, que bien puede estar

    conformado por los miembros de un departamento, o por los

    usuarios de un determinado nivel organizativo, o por un equipo de

    trabajo multidisciplinario con objetivos comunes.

    Los data mart, se utilizan para almacenar informacin de

    un grupo de reas en particular, cuyo flujo de informacin sea

    coincidente; por ejemplo, podran ser de marketing y ventas o de

    produccin. Lo usual es que stos se definan para dar respuestas a

    usos muy concretos.

    Por lo general, los data mart son ms pequeos que los

    data warehouses. Tambin almacenan menor cantidad de

    informacin, menos modelos de negocio ya que son utilizados por

    un menor nmero de usuarios.

    Existen dos tipos de data mart, estos pueden ser

    independientes o dependientes. Los independientes son

    alimentados directamente desde las fuentes de informacin,

    mientras que los independientes obtienen la informacin desde el

    data warehousecorporativo. Con los data mart independientes

    pueden surgir inconvenientes en su evolucin, ya que pueden

    llegar a generar inconsistencias con otros data mart.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 38

    En la figura 5 puede apreciarse la estructura de los data

    marts dentro de una solucin de Inteligencia de Negocios.

    Figura 5: Data marts

    Existen grandes diferencias entre los sistemas

    transaccionales y los data warehouses, en funcin a los objetivos

    que persiguen cada una de ellos.

    El objetivo primordial del modelo relacional en el cual se

    basa el concepto OLTP es el de mantener la integridad de la

    informacin en cuanto a las relaciones entre los datos, lo cuales

    necesario para operar un negocio de la manera ms eficiente. Sin

    embargo, este modelo no se corresponde con la forma en la que

    el usuario percibe la operacin de un negocio.

    Los data werehouses estn basados en un procesamiento

    de los datos distinto al utilizado por los sistemas operacionales, ya

    que este se basa en el concepto OLAP pensado y utilizado en el

    anlisis de negocios y otras aplicaciones que requieren una visin

    flexible del negocio.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 39

    A continuacin en la Tabla 1 se presentan las principales

    diferencias entre los sistemas transaccionales (OLTP) y los

    basados en data warehouses (OLAP).

    Transaccionales Basados en Data warehouse

    Admiten el acceso simultneo de muchos usuarios

    (miles) que agregan y modifican datos.

    Admiten el acceso simultaneo de muchos usuarios

    (cientos) que consultan y no modifican datos

    Representan el estado actual de una organizacin,

    pero no guardan su historial.

    Guardan el historial de una organizacin.

    Contienen grandes cantidades de datos, incluidos

    los datos extensivos utilizados para comprobar

    transacciones.

    Contienen grandes cantidades de datos, sumarizados,

    consolidados y transformados. Tambin de detalle

    pero solo los necesarios para el anlisis.

    Tienen estructuras de base de datos complejas Tienen estructuras de base de datos simples.

    Se ajustan para dar respuesta a la actividad

    transaccional.

    Se ajustan para dar respuesta a la actividad de

    consultas.

    Proporcionan la infraestructura tecnolgica

    necesaria para admitir las operaciones diarias de la

    empresa.

    Pueden combinar datos de orgenes heterogneos en

    una nica estructura homognea y simple, facilitando

    la creacin de informes y consultas.

    Las consultas analticas que resumen grandes

    volmenes de datos afectan negativamente a la

    capacidad del sistema para responder a las

    transacciones en lnea.

    Organizan los datos en estructuras simplificadas

    buscando la eficiencia de las consultas analticas ms

    que del proceso de transacciones.

    El rendimiento del sistema cuando est

    respondiendo a consultas analticas complejas

    puede ser lento o impredecible, lo que causa un

    servicio poco eficiente a los usuarios del proceso

    analtico en lnea.

    Contienen datos transformados que son vlidos,

    coherentes, consolidados y con el formato adecuado

    para realizar el anlisis sin interferir en la operacin

    transaccional diaria.

    Los datos que se modifican con frecuencia

    interfieren en la coherencia de la informacin

    analtica.

    Proporcional datos estables que representan el

    historial de la empresa. Se actualizan peridicamente

    con datos adicionales, no como las transaccionales

    frecuentes.

    La seguridad se complica cuando se combina

    anlisis en lneas con el proceso de transacciones

    en lnea.

    Simplifican los requisitos de seguridad.

    Tabla 1: Diferencias entre sistemas OLTP y OLAP.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 40

    2.9.4. Herramientas de acceso de la Inteligencia de Negocios

    La informacin almacenada en un data warehouse, seria

    intrascendente, si sta no pudiera ser accedida por los usuarios,

    para ello existen herramientas que permiten tratar y visualizar la

    informacin que reside en un data warehouse.

    En la seccin resaltada de la figura 6 se aprecia la

    ubicacin de las herramientas de acceso en una solucin de

    Inteligencias de Negocios.

    Figura 6: Herramientas de acceso.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 41

    Existen diferentes tecnologas que permiten aprovechar y

    analizar la informacin almacenada en un data warehouse, siendo

    el uso de los cubos OLAP la ms extendida de ellas.

    Los usuarios que toman decisiones necesitan analizar

    informacin a distintos niveles de agregacin y tener una visin

    sobre mltiples dimensiones, por ejemplo, las ventas de

    determinados productos por zonas, por tiempo, por clientes o por

    regin geogrfica. Estos usuarios deben poder realizar este

    anlisis al mximo nivel de agregacin o al mximo nivel de

    detalle. Los cubos OLAP permiten realizar esto de modo a poder

    aprovechar al mximo las posibilidades que ofrecen los data

    warehouses.

    A estos tipos de anlisis se los denomina

    multidimensionales, ya que permiten el anlisis de un hecho en

    particular desde distintas dimensiones. Esta es la mejor forma de

    analizar la informacin por parte de los tomadores de decisiones,

    ya que los modelos de negocio habitualmente son

    multidimensionales.

    Las herramientas que se utilizan para la visualizacin de la

    informacin,son totalmente independientes a la forma en la que

    sta se haya almacenado.

    Las formas de acceso de las herramientas OLAP son:

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 42

    Cliente/Servidor: esto significa tener instalado en la

    maquinas cliente, el aplicativo que va conectarse al

    servidor donde se almacenan la informacin que generan

    los cubos OLAP.

    Acceso web: en este tipo de acceso, el navegador es el que

    se comunica con un servidor web, el cual se comunica con

    el servidor OLAP donde se almacena la informacin que

    generan los cubos.

    2.10. Principales herramientas de la Inteligencia de Negocios

    Generadores de informes: estos son utilizados por desarrolladores

    profesionales para crear informes estandarizados enfocados a

    departamentos, grupos interdepartamentales o la organizacin.

    Herramientas de usuario final de consultas e informes: estas son

    utilizados por los usuarios finales para crear informes para su

    propio uso o para otros usuarios; no requieren programacin.

    Herramientas OLAP: estas permiten a los usuarios finales

    manipular la informacin de forma multidimensional para poder

    visualizarla desde distintas perspectivas y en funcin a los criterios

    que el usuario considere importantes.

    Herramientas de cuadros de mandos: estas permiten a los usuarios

    finales visualizar informacin crtica para el desempeo de manera

    rpida, valindose para ello de grficos, ofreciendo la posibilidad

    de visualizar alguna seccin con ms en detalle.

    Herramientas de minera de datos: estas permiten a los analistas de

    negocio crear modelos estadsticos. La minera de datos es el

    proceso para descubrir e interpretar patrones ocultos a simple vista

    en un gran cmulo de informacin. Los usos ms habituales de la

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 43

    minera de datos son: segmentacin, clasificacin, previsiones,

    agrupacin, etc.

    2.11. Minera de datos

    2.11.1. Conceptos e historia de la minera de datos

    El termino minera de datos, desde el enfoque acadmico

    es una de las etapas dentro del proceso de Knowledge Discovery

    in Databases(en adelante KDD).

    Bsicamente la minera de datos consiste en nutrirse de las

    ventajas de cada area como la estadstica, inteligencia artificial,

    computacin grfica, bases de datos y procesamiento masivo,

    utilizando como materia prima las bases de datos operaciones.

    Definicin tradicional de minera de datos: [..]esun

    proceso no trivial de identicacin vlida, novedosa,

    potencialmente til y entendible de patrones comprensibles que

    se encuentran ocultos en los datos (FAYYAD,U 1.996).

    Desde el punto de vista empresarial, la minera de

    datos se define como: [..]La integracin de un conjunto de

    reas que tienen como propsito la identificacin de un

    conocimiento obtenido a partir de las bases de datos que aporten

    un sesgo hacia la toma de decisin (MOLINA, L 2.001).

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 44

    La idea de la minera de datos viene desde los aos 60,

    cuando los estadsticos de esa poca manejaban trminos como

    data fishing, data mining o data archeology,ms tarde en los aos

    80, Rakesh Agrawal, Gio Wiederhold, Robert Blum y Gregory

    Piatetsky-Shapiro, entre otros empezaron a fortalecer los trminos

    de data mining y KDD.

    A finales de los aos 80 solo existan un par de empresas

    quienes se dedicaban a esta tecnologa; para el 2.002 este nmero

    se multiplic considerablemente, ya que existan ms de 100

    empresas en el mundo con un portafolio de ms de 300 soluciones

    que utilizaban la tecnologa.

    La minera de datos no es un gran software ni algo

    parecido, ms bien la tecnologa est compuesta por etapas que

    integran diferentes reas. Tanto as que para el desarrollo de un

    proyecto de minera de datos, se utilizan diferentes aplicaciones

    de software para las distintas etapas.

    En la actualidad podemos encontrar una variedad

    importante de herramientas o aplicaciones comerciales y no

    comerciales con una utilera interesante, pero casi siempre es

    necesario complementar con otras herramientas para el desarrollo

    de la minera de datos.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 45

    2.11.2. Los fundamentos de la minera de datos.

    Las tcnicas de minera de datos, se considera al resultado

    de un proceso de investigacin y desarrollo de productos.

    La evolucin comenz cuando las organizaciones

    empezaron a guardar sus datos en las computadoras, esto fue

    creciendo cuando se mejoraron el acceso a los datos permitiendo

    al usuario navegar y explorar en tiempo real sus datos.

    La minera de datos tomando este proceso de evolucin

    est lista para ser implementada en las organizaciones, utilizando

    estas tres tecnologas que ya estn muy consolidadas como pilares

    de su aplicacin:

    Recoleccin masiva de datos.

    Potentes computadoras con multiprocesadores.

    Algoritmos de minera de datos.

    2.11.3. Objetivos de la minera de datos

    Examinar, analizar y buscar patrones ocultos en los datos

    acumulados en las profundidades de las bases de datos o en

    almacenes de datos que contienen datos histricos que ha

    generado una organizacin durante su existencia.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 46

    2.11.4. Entorno de la minera de datos

    La minera de datos normalmente utiliza la arquitectura

    cliente-servidor.

    La minera de datos a travs de sus herramientas ayuda a

    extraer informacin oculta, archivos acumulados en las bases de

    datos operaciones y/o almacenes de datos de las grandes

    corporaciones pblicas y privadas.

    Los usuarios de la minera de datos normalmente no

    cuentan con ninguna habilidad de programacin, por los cual se

    valen de las poderosas herramientas para efectuar consultas adhoc

    y obtener respuestas en tiempo real.

    La minera de datos es capaz de producir seis tipos de

    informacin:

    Asociaciones.

    Agrupamientos.

    Clasificaciones.

    Pronsticos.

    Secuencias.

    Clasificaciones.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 47

    2.11.5. El alcance de la minera de datos

    La minera de datos consiste en buscar valiosas

    informaciones en grandes bases de datos. Este proceso requiere

    explorar grandes cantidades de datos y analizarlos

    minuciosamente hasta encontrar las informaciones requeridas.

    En las bases de datos de gran volumen y calidad, la

    minera de datos puede proporcionarnos oportunidades de

    negocio con las siguientes posibilidades:

    Pronstico de comportamiento a futuro: la minera de

    datos proporciona la automatizacin del proceso de

    obtencin de informacin predecible en bases de datos de

    gran volumen, estos pronsticos pueden ser la prediccin

    de las ventas, posibles problemas financieros, similitudes

    de necesidades de los clientes y un sinfn de predicciones

    que el negocio requiera.

    Las herramientas para visualizar, examinar y realizar el

    anlisis de los resultados.

    2.12. Resea histrica del Grupo Flayp

    En el ao 1.983 tras el cierre de las actividades en Paraguay de la

    Multinacional AVON Cosmetics Inc., se crea Flayp S.R.L., con el objetivo

    de convertirse en una empresa nacional para la venta y distribucin de los

    productos AVON, adquiriendo para esto la franquicia de dicha marca, tiene

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 48

    como visin ser la empresa lder en venta directa y comercializacin de

    artculos de belleza, llegando a cada rincn del Paraguay, ofreciendo

    calidad y excelencia a sus clientes.

    En sus inicios contaba con 5 empleados y 120 revendedoras. En la

    actualidad la empresa Flayp S.R.L. se transform en el Grupo Flayp,

    compuesto por las siguientes empresas: Flayp S.R.L.; Vir S.R.L.;

    Flayprint S.A.; City Sport S.A.; Cima Seis S.A.; Flaypnort S.A., las cuales

    si bien estn nucleadas en un directorio, son totalmente independientes

    administrativa, econmica y operativamente entre s.

    Hoy en da el Grupo Flayp cuenta con ms de 700 empleados

    directos y ms de 30.000 revendedoras a lo largo de todo el pas. A ms del

    directorio, compuesto actualmente por sus 6 miembros fundadores, el

    Grupo cuenta con un gerente general, y para cada una de las empresas un

    gerente en cada rea estratgica (Marketing, Ventas, Compras,

    Administrativo, Logstica, Tecnologa e Informacin).

    En cuanto a tecnologa, el Grupo cuenta en la actualidad con 5

    servidores, 2 de los cuales son utilizados para albergar en forma

    independiente cada uno de los sistemas de procesamiento de pedidos,

    facturacin y cuenta corriente de cada una de las empresas, dichos

    sistemas informticos se encuentran desarrollados en distintos lenguajes de

    programacin y distintos orgenes de datos, adems de eso, cuenta con una

    conexin Virtual Private Network (en adelante VPN), con muchas de las

    sucursales en el interior del pas y el rea metropolitana, las cuales realizan

    sus transacciones directamente a las bases de datos contenidas en los

    servidores, las agencias que no cuentan con acceso a internet, envan sus

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 49

    pedidos utilizando los vehculos de la empresa, dichos pedidos son

    procesados en un centro de procesamiento.

    Actualmente el Grupo Flayp maneja un volumen de compras

    cercano a los 10.000.000 u$s anuales (comprende las dos principales

    empresas del Grupo; Vir S.R.L. y Flayp S.R.L.) y un volumen de ventas

    que ronda los 24.000.000 u$s anuales. En cuanto a unidades vendidas, las

    mismas superan los 7.000.000 anuales. Con una proyeccin de crecimiento

    entre el 10% y el 14% anual. El Grupo Flayp cuenta con una casa central

    en Asuncin, adems de contar con ms de 45 agencias distribuidas en

    todo el pas, logrando as una cobertura total, posee 2 depsitos que

    albergan las mercaderas, adems de una flota de camiones, los cuales son

    utilizados para la distribucin de los productos.

    El Grupo empresarial cuenta con un equipo de ventas, liderados por

    su gerente de ventas, quien tiene a su cargo a 4 gerentes divisionales, los

    cuales se dividen la cobertura del pas en 4 grandes regiones, adems

    cuenta con ms de 350 zonas, las cuales estn distribuidas en cada una de

    las 4 divisiones y que su vez se encuentran presentes en todos los

    departamentos del pas, cada zona es gerenciada por una promotora de

    ventas y que a su vez tienen a su cargo el manejo de las 30.000

    revendedoras. Por otro lado cabe mencionar que el sistema de venta directa

    tiene una dinmica diferente a la venta convencional, el mismo consiste en

    ofrecer sus productos a travs de folletos los cuales son ofrecidos por las

    revendedoras, la vigencia promedio de cada folleto es de 18 das, esto lleva

    a tener 20 folletos por ao, que son denominadas campaas, por lo tanto la

    facturacin se maneja por campaas y no as por fecha calendario. De esto

    se desprende que toda la informacin que manejan las empresas del

    grupo, corresponden a este esquema organizacional.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 50

    2.13. Resea histrica del software libre

    En los primeros pasos de la informtica, los programas y las

    mquinas utilizadas para su ejecucin estaban estrechamente ligados. No

    se conceba el concepto de programa como elemento separado tal cual se

    tiene hoy en da.

    Tampoco existan usuarios comunes, sino que la totalidad de las

    personas que ejecutaban los programas tenan grandes conocimientos de

    programacin y por lo general eran ingenieros y cientficos, una costumbre

    muy practicada entre estos usuarios, era intercambiar y mejorar los

    programas, distribuyendo sus modificaciones.

    No fue hasta los ltimos aos de la dcada del 70, cuando las

    empresas comenzaron con la costumbre de imponer restricciones a los

    usuarios, con la implementacin de los acuerdos de licencia.

    2.13.1. Richard Stallman y el proyecto GNU

    Para empezar a entender todo lo que implica el software

    libre, es imprescindible hablar de Richard Stallman. Este fsico

    graduado en 1.974 en la Universidad de Harvard, se encontraba

    trabajando en los laboratorios de inteligencia artificial del

    Instituto de Tecnologa de Massachussetts(en adelante MIT)

    desde el ao 1.971.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 51

    La impresora con la que contaban en su laboratorio tena

    algunos inconvenientes con la alimentacin del papel, lo que

    haca que se atascara de forma permanente y no haba forma de

    descubrirlo ms que acercarse hasta donde se encontraba la

    misma.

    Por este motivo, Stallman contacta con la empresa

    fabricante de la impresora, con el propsito de modificar el

    software que se encargaba de controlar a la impresora y lograr

    hacer que la misma mande una seal cuando se atascaba,

    consiguiendo con esto que no se perdiese tanto tiempo de trabajo.

    Ante este pedido, los fabricantes se negaron a entregarle el

    cdigo fuente, los cuales son imprescindibles para poder

    modificar su comportamiento. Esta situacin hace que termine de

    tomar forma su idea de que el cdigo fuente de los programas

    deba ser accesible para todo aquel que quisiese.

    Movilizado por esta inquietud, Stallman decidi

    abandonar el MIT a comienzos de 1.984, para dar inicio al

    proyecto GNU, el mismo es un acrnimo recursivo que significa

    GNU's Not Unix, GNU No Es Unix, haciendo referencia a que el

    proyecto tena como objetivo desarrollar un sistema operativo tipo

    Unix, pero totalmente libre.

    Tiempo despus Stallman funda la Free Software

    Foundation (en adelante FSF), entidad encargada de promocionar

    el desarrollo y uso del software libre, en 1.985 Stallman cre la

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 52

    licencia General Public License (en adelante GPL) como

    mecanismo para proteger el software libre, sustentado sobre el

    concepto de copyleft, la FSF tiene un registro de todas licencias

    compatibles con la licencia GNU (la ms popular de las licencias

    de software libre) y aquellas que, no siendo compatibles con ella,

    son consideradas licencias de software libre.

    En sus comienzos, el proyecto GNU se concentra en

    desarrollar las herramientas necesarias para construir un sistema

    operativo, como ser editores y compiladores y en las utilidades

    bsicas para la gestin del sistema.

    A travs del concepto de copyleft, se busca una alternativa

    a la idea del copyright, siendo que todo el mundo tiene derecho a

    ejecutar un programa, copiarlo, modificarlo y distribuir las

    versiones modificadas, pero no tiene permiso para aadir sus

    propias restricciones al mismo. De esta forma, las libertades que

    definen al software libre estn garantizadas para todo el mundo

    que tenga una copia, tornndose en derechos inalienables.

    2.13.2. Software Libre

    Lo primero que debe entenderse cuando se habla

    desoftware libre, es que no se est hablando de software gratis, el

    alcance de la palabra libre es mucho ms abarcativa, se refiere a la

    libertad de los usuarios para ejecutar, copiar, distribuir, estudiar,

    cambiar y mejorar el software. De modo ms preciso, se refiere a

    cuatro libertades de los usuarios del software. (GNU, 2008).

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 53

    Es entonces que se tiene dentro de las distintas

    clasificaciones de software, una muy determinante, como lo es

    clasificar al software de acuerdo a su filosofa.

    Softwarepropietario: se entiende por esto, el software cuya

    propiedad absoluta continua en poder de quien tiene sus derechos

    y no del usuario, quien solo puede utilizarlo cumpliendo ciertas

    condiciones. Siendo as que su uso, distribucin y/o modificacin

    total o parcial, estn prohibidos o restringidos de tal manera que

    no es posible llevarlos adelante. Es decir, que el software

    comercializado bajo este tipo de licencias le da al usuario

    derechos limitados sobre su usufructo, el alcance de esto es

    establecido por el autor o quien posea ese derecho.

    Software libre: se considera as, al software que le otorga

    al usuario la libertad de utilizarlo, mejorarlo, estudiarlo, adaptarlo

    a sus necesidades y redistribuirlo libremente, con la nica

    limitacin de no sumarle ningn tipo de restriccin agregado al

    software luego de modificado. Es importante destacar que para

    considerar a un software como libre, se debe permitir el acceso al

    cdigo fuente, por cuanto esto es una condicin imprescindible

    para ejercer las libertades de estudiarlo, modificarlo, mejorarlo y

    adaptarlo (FSF, 2009).

    Cuando se habla de softwarelibre es necesario hacer

    mencin a las cuatro libertades bsicas de su filosofa segn la

    Fundacin de Software Libre.

  • Inteligencia de Negocios Tesis de Grado Ingeniera en Informtica

    Universidad del Cono Sur de las Amricas 54

    2.13.3. Libertades bsicas del software libre

    Libertad cero: usar el programa con cualquier propsito.

    Esta libertad es la que garantiza que se puede utilizar el programa

    para cualquier fin, sea este comercial, educativo, cultural, etc.

    Esta libertad est en contraposicin a las licencias que limitan la

    utilizacin del software a un propsito determinado, o que

    restringen su uso para ciertas actividades.

    Libertad uno: Estudiar cmo funciona el programa, y

    adaptarlo a nuestras necesidades. Esto se traduce en que se puede

    estudiar el funcionamiento (para ello se debe tener acceso al

    cdigo fuente del programa) lo que permitir, descubrir

    funcionalidades ocultas, conocer de qu manera realiza

    determinada tarea, averiguar que otras opciones tiene, que ms se

    le puede agregar, etc. El hecho de poder adecuar el programa,

    implica que se pueden eliminar partes que no se necesitan,

    agregarle elementos que se consideren importantes, etc.

    Libertad dos: Distribuir copias. Esto quiere decir que se

    tiene la libertad redistribuir el programa, ya sea de forma gratuita

    o cobrando por el servicio, pudiendo realizar esto por e-mail, CD,

    o algn medio de almacenamiento, ya sea a una persona o a

    varias, etc.

    Libertad tres: Mejorar el programa, y liberar las mejoras

    a todos. Por esto se entiende que se tiene la libertad de mejorar el

    programa, traducind