tarea datawarehouse diego nauto

13
Universidad Austral de Chile Facultad de Ciencias Económicas y Administrativas Instituto de Administración Escuela de Ingeniería Comercial ADMI 273 Tarea N° 4: DATAWAREHOUSE Curso: Sistema de Información Empresarial Profesor: Cristian Salazar Ayudante: José Luis Daniel Carrasco Integrante: Diego Nauto C. Valdivia, 3O de Noviembre de 2010.

Upload: diego-nauto

Post on 08-Jul-2015

220 views

Category:

Documents


0 download

TRANSCRIPT

Universidad Austral de ChileFacultad de Ciencias Económicas y Administrativas

Instituto de AdministraciónEscuela de Ingeniería Comercial

ADMI 273

Tarea N° 4: DATAWAREHOUSE

Curso: Sistema de Información Empresarial Profesor: Cristian Salazar

Ayudante: José Luis Daniel Carrasco

Integrante:

Diego Nauto C.

Valdivia, 3O de Noviembre de 2010.

Introducción.

En un comienzo solo se contaba con bases de datos que guardaban la información, para que luego aparecieran nuevos sistemas que a parte de guardar información, ofrecían un enfoque gerencial, para la toma final de decisiones.

Las organizaciones para poder tener una mejor propuesta laboral, necesitan de la recolección y almacenaje de información además de datos para la mejor toma de decisiones. El correcto análisis acerca de inteligencia de negocios es realizado en colaboración de otras herramientas que ayudan al mejor desempeño corporativo.

El buen conocimiento y aplicación de los conceptos analizados en este trabajo serán sin duda de gran apoyo para las organizaciones y así poder tener una ventaja competitiva y tener un mejor desempeño.

La globalización que nos mueve día a día, nos hace adentrarnos mucho mas a la tecnología, la cual para una persona común y corriente como yo antes de iniciar este curso era solo saber navegar y utilizar las diferentes herramientas tan comunes en la web, es por eso que con el inicio del curso “Sistema de la Información”, me di cuenta de que todo lo que había utilizado y que yo creía mantener “al día” y a la “vanguardia” en lo que respecta a la tecnología de la información, era tan solo una minima parte.

Es por eso que trabajos como el realizado, en el cual uno se da cuenta que el avance logrado a lo largo del curso a sido optimo y lleno de conocimientos, conceptos y practica, lo invitan a seguir interiorizándose en temas como Business Intelligence, ETL o ERPs, los cuales son habilidades, gestión y componentes si pudiéramos resumirlo así dentro de una idea o proyecto a generar.

Es por eso que también términos como Interfase Web o Modelo de Datos, nos han ayudado a trabajar con programas como “PLSQL Developer”, en conjunto con modelos como el de entidad-relación, UML y OO.

Finalmente, podemos decir que el datawarehouse, es una gran colección, en la cual se recoge mucha información, de diversas fuentes y diversas operaciones, las cuales nos ayudaran a tomar una decisión, la cual en nuestro rol de Ingeniero Comercial, nos ayuda a sentenciar si por ejemplo un proyecto tiene o no vigencia, o si se sigue o no con un plan de ventas, debido a que nosotros somos los que gestionamos la empresa. Por tal motivo, si en un futuro no muy lejano, estemos en un gran sillón realizando otro tipo de actividades, es muy necesario dentro de la formación académica como profesional tener ese conocimiento técnico, para tener y saber el leguaje común con el resto de personal de una determinada empresa en la cual se trabaja, porque como decía anteriormente uno es quien gestiona la empresa.

I. Debe investigar los siguientes términos.

Business Intelligence:

Business Intelligence es la habilidad para transformar los datos en información, y la información en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.

Desde un punto de vista más pragmático, y asociándolo directamente con las tecnologías de la información, podemos definir Business Intelligence como el conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada, para su explotación directa (reporting, análisis OLTP / OLAP, alertas...) o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio.

La inteligencia de negocio actúa como un factor estratégico para una empresa u organización, generando una potencial ventaja competitiva, que no es otra que proporcionar información privilegiada para responder a los problemas de negocio: entrada a nuevos mercados, promociones u ofertas de productos, eliminación de islas de información, control financiero, optimización de costes, planificación de la producción, análisis de perfiles de clientes o rentabilidad de un producto concreto.

ERPs.

Los sistemas de gestión empresarial (en inglés ERP, acrónimo de Enterprise Resource Planning) son sistemas de gestión de información que integran y automatizan muchas de las prácticas de negocio asociadas con los aspectos operativos o productivos de una empresa, eliminando complejas conexiones entre sistemas de distintos proveedores.

Este tipo de sistemas suele presentar una arquitectura modular, donde cada módulo gestiona las funciones de un área empresarial diferente, como pueden ser: nóminas, finanzas, gestión de proyectos, sistema de gestión geográfica, contabilidad, logística, stock, pedidos. Estas áreas de la empresa realizan funciones diferentes pero se interrelacionan entre sí compartiendo información. Es importante resaltar que los sistemas ERP, son integrales, es decir, una agrupación de todos los módulos que los componen, y que agrupan a su vez todos los procesos de gestión de la empresa.

ETL.

Sigla que en ingles extract, transform and load que en español significa extraer, transformar y cargar, es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.

Microsoft Integration Services es una plataforma para crear soluciones de integración de datos de alto rendimiento, incluidos los paquetes de extracción, transformación y carga (ETL) para el almacenamiento de datos.

Los procesos ETL (Extraction, Transformation and Loading - extracción, transformación y carga) son los componentes más importantes y de valor añadido de una infraestructura de Business Intelligence (BI). Aún pueden ser invisibles por los usuarios de la plataforma de BI, los procesos ETL recuperan los datos de todos los sistemas operativos y les pre-elaboran para las herramientas de análisis y de reporting. La exactitud de la plataforma BI entera depende de los procesos ETL.

Interfase Web.

Es la parte de una Aplicación que se encarga de interactuar con el usuario. Los diseñadores del programa crean esta "parte visible" que permite al usuario establecer una comunicación con la aplicación, mediante las herramientas que puede utilizar para manejarla. Una buena interfaz de un diseño web debe ser intuitiva y permitir al usuario identificar con facilidad sus componentes mediante la utilización de símbolos, iconos o cualquier tipo de objeto que sirva para que el usuario entienda mejor el software. Dentro de la informática, hay otros ámbitos donde se utiliza el término interfaz:

• Conjunto de comandos y/o métodos que permiten la intercomunicación de un programa con cualquier otro o entre partes (módulos) del propio programa. De hecho, los periféricos son controlados por interfaces.

• En el Lenguaje de programación C++, una interfaz de personas es la parte del interfaz informático que permite la circulación correcta y sencilla de información entre varias aplicaciones y entre el propio programa y el monousuario.

• Dentro del hardware, una interfaz es el puerto (circuito físico) a través del que se envían o reciben señales desde un sistema o subsistemas hacia otros.

Modelo de Datos.

Un modelo de datos es un lenguaje orientado a describir una Base de Datos. Típicamente un modelo de datos permite describir:

Las estructuras de datos de la base: El tipo de los datos que hay en la base y la forma en que se relacionan.

Las restricciones de integridad: Un conjunto de condiciones que deben cumplir los datos para reflejar correctamente la realidad deseada.

Operaciones de manipulación de los datos: típicamente, operaciones de agregado, borrado, modificación y recuperación de los datos de la base.

Otro enfoque es pensar que un modelo de datos permite describir los elementos de la realidad que intervienen en un problema dado y la forma en que se relacionan esos elementos entre sí.

No hay que perder de vista que una Base de Datos siempre está orientada a resolver un problema determinado, por lo que los dos enfoques propuestos son necesarios en cualquier desarrollo de software. La mayoría de los modelos de datos poseen un conjunto de operaciones básicas para especificar consultas y actualizaciones de la base de datos.

El modelado de datos es uno de los elementos más importantes a la hora de iniciar el desarrollo de cualquier proyecto. Esta es la estructura, sobre la que realmente reside la verdadera esencia de la aplicación. Incluso determina si el proyecto va a cumplir con su verdadero objetivo.

ER (Entidad Relación).

El modelo entidad-relación es una técnica para definir las necesidades de información de la organización. Este modelo implica identificar los asuntos de importancia dentro de una organización (entidades), las propiedades de esos asuntos (atributos y cómo se relacionan entre sí (relación).

El modelo de datos más extendido es el denominado ENTIDAD/RELACIÓN (E/R) En el modelo E/R se parte de una situación real a partir de la cual se definen entidades y relaciones entre dichas entidades:

• Entidad: Objeto del mundo real sobre el que queremos almacenar información (Ej: una persona). Las entidades están compuestas de atributos que son los datos que definen el objeto (para la entidad persona serían, nombre, apellidos, dirección,...). De entre los atributos habrá uno o un conjunto de ellos que no se repite; a este atributo o conjunto de atributos se le llama “clave” de la entidad, (para la entidad persona una clave seria DNI).

• En toda entidad siempre hay al menos una clave que en el peor de los casos estará formada por todos los atributos de la tabla. Ya que pueden haber varias claves y necesitamos elegir una, lo haremos atendiendo a estas normas:

• Que sea única.• Que se tenga pleno conocimiento de ella.- ¿Por qué en las empresas se asigna a cada

cliente un número de cliente?• Que sea mínima, ya que será muy utilizada por el gestor de base de datos.• Relación.- Asociación entre entidades, sin existencia propia en el mundo real que

estamos modelando, pero necesaria para reflejar las interacciones existentes entre entidades. Las relaciones pueden ser de tres tipos:

• Relaciones 1-1.- Las entidades que intervienen en la relación se asocian una a una (Ej: la entidad HOMBRE, la entidad MUJER y entre ellos la relación MATRIMONIO).

• Relaciones 1-n.- Una ocurrencia de una entidad está asociada con muchas (n) de otra (Ej: la entidad EMPERSA, la entidad TRABAJADOR y entre ellos la relación TRABAJAR-EN).

• Relaciones n-n.-Cada ocurrencia, en cualquiera de las dos entidades de la relación, puede estar asociada con muchas (n) de la otra y viceversa (Ej: la entidad ALUMNO, la entidad EMPRESA y entre ellos la relación MATRÍCULA).

Relación 1 a 1.

Indicamos con este ejemplo que existe una relación de pertenencia de uno a uno, ya que existe una tarjeta de circulación registrada por cada automóvil.

En este ejemplo, representamos que existe un solo presidente para cada país.

Relación muchos a muchos.

UML (Lenguaje de Modelado Unificado)

Una exigencia de la gran mayoría de instituciones dentro de su Plan Informático estratégico, es que los desarrollos de software bajo una arquitectura en Capas, se formalicen con un lenguaje estándar y unificado.

Es decir, se requiere que cada una de las partes que comprende el desarrollo de todo software de diseño orientado a objetos, se visualice, especifique y documente con lenguaje común. Se necesitaba un lenguaje que fuese gráfico, a fin de especificar y documentar un sistema de software, de un modo estándar incluyendo aspectos conceptuales tales como procesos de negocios y funciones del sistema.

Este lenguaje unificado que cumple con estos requerimientos, es ciertamente UML, el cual cuenta con una notación estándar y semánticas esenciales para el modelado de un sistema orientado a objetos.

El lenguaje para modelamiento unificado (UML), es un lenguaje para la especificación, visualización, construcción y documentación de los artefactos de un proceso de sistema intensivo. Fue originalmente concebido por la Corporación Rational Software y tres de los más prominentes métodologistas en la industria de la tecnología y sistemas de información: Grady Booch, James Rumbaugh, y Ivar Jacobson ("The Three Amigos"). El lenguaje ha ganado un significante soporte de la industria de varias organizaciones vía el consorcio de socios de UML y ha sido presentado al Object Management Group (OMG) y aprobado por éste como un estándar (noviembre 17 de 1997).

OO (Orientado a Objetos).

Hoy en día la tecnología orientada a objetos ya no se aplica solamente a los lenguajes de programación, además se viene aplicando en el análisis y diseño con mucho éxito, al igual que en las bases de datos. Es que para hacer una buena programación orientada a objetos hay que desarrollar todo el sistema aplicando esta tecnología, de ahí la importancia del análisis y el diseño orientado a objetos.

La programación orientada a objetos es una de las formas más populares de programar y viene teniendo gran acogida en el desarrollo de proyectos de software desde los últimos años. Esta acogida se debe a sus grandes capacidades y ventajas frente a las antiguas formas de programar.

La Programación Orientada a Objetos desde el punto de vista computacional "es un método de implementación en el cuál los programas son organizados como grupos cooperativos de objetos, cada uno de los cuales representa una instancia de alguna clase, y estas clases, todas son miembros de una jerarquía de clases unidas vía relaciones de herencia", donde se destacan las siguientes ventajas:

• Fomenta la reutilización y extensión del código.• Permite crear sistemas más complejos.• Relacionar el sistema al mundo real.• Facilita la creación de programas visuales.• Construcción de prototipos• Agiliza el desarrollo de software• Facilita el trabajo en equipo• Facilita el mantenimiento del software

ll. Describir cada etapa del diseño de un DW o almacén de datos.

Etapas del Diseño Warehouse

• Origen (Source): Define los orígenes de datos del Almacén de Datos, como los

sistemas de Procesamiento de Transacciones en Línea (On-Line Transaction Processing, OLTP), las fuentes de datos externas (datos sindicados, datos censales), etc.

• Integración (Integration): Define el mapeo entre los orígenes de datos y el propio Almacén de Datos.

• Almacén de Datos (Data Warehouse):Define la estructura del Almacén de Datos.

• Adaptación (Customization): Define el mapeo entre el Almacén de Datos y las estructuras empleadas por el cliente.

• Cliente (Client): Define las estructuras concretas que son empleadas por los clientes para acceder al Almacén de Datos, como Data Marts o aplicaciones OLAP.

Cada una de las etapas es analizado por las siguientes etapas y en el mismo orden, losniveles por Etapa del Diseño del Almacén de Datos

• Conceptual: Define el Almacén de Datos desde un punto de vista conceptual, es decir, desde el mayor nivel de abstracción y contiene únicamente los objetos y relaciones más importantes.

• Lógico: Abarca aspectos lógicos del diseño del Almacén de Datos, como la definición de las tablas y claves, la definición de los procesos ETL, etc.

• Físico: Define los aspectos físicos del Almacén de Datos, como el almacenamiento de las estructuras lógicas en diferentes discos o la configuración de los servidores de bases de datos que mantienen el almacén de datos.

(http://hp.fciencias.unam.mx/~alg/bd/dwh.pdf)

III. Modelos de DW.

• Star Schema:

• Snowflake Shema:

IV) Buscar un área de negocio en el cual sea interesante desarrollar/aplicar BI.

Vamos a trabajar con el área de ventas Belsport.

Sucursales

Las sucursales de Belsport las podemos dividir en dos: • Sucursales de Santiago • Sucursales de Regiones, las cuales serian las siguientes:

Sucursales Santiago• Mall Plaza Norte.• Apumanque.• Mall Parque Arauco.• Mall del centro.• Paseo Ahumada.• Mall Plaza Alameda.• Paseo Arauco Estación.• Mall Plaza Oeste.• Mall Arauco Maipú.• Mall Plaza del Sur.• San Bernardo.• Mall Florida Center.• Mall Plaza Vespucio.• Plaza Puente.• Puente Alto.

Sucursales Regiones• Mall Calama.• Mall Plaza Antofagasta.• Copiapó.• Mall Plaza La Serena.• Viña de Mar centro.• Mall Valparaíso.• Rancagua.• Mall Center Curico.• Plaza Trébol (Talcahuano).• Mall plaza El Roble (Chillan).• Concepción.• Mall Plaza Los Ángeles.• Mall Portal Temuco.• Mall Plaza de Los Ríos (Valdivia)• Mall Paseo Costanera (Pto. Montt)• Mall Espacio Urbano(Pta. Arenas)

Marcas:

También cada marca la podemos subdividir en los productos que ofrece cada marca; donde podemos encontrar, accesorios deportivos como:

• Buzos deportivos de diferentes marcas.• Pantalones deportivos largos y cortos.• Zapatillas de futbol y baby futbol• Gorros (de lana y con visera)• Guantes de arquero y lana.• Pelotas de futbol, basketball y voleibol.• Medias deportivas.• Camisetas de equipo de futbol.• Canilleras deportivas.

Tiempo: Al ser Belsport una tienda principalmente de ropa y calzado, la podemos dividir en las temporadas en que trabaja la tienda

Temporada Primavera – Verano• Día• Mes• Año

Temporada Otoño Invierno• Día• Mes• Año

El data Warehouse, quedaría de la siguiente forma:

Conclusión.

Sucursales

VentasRockford

Unidades

Monto

SucursalesSantiago

SucursalesRegiones

Región Región

Ciuda Ciuda

Marca

Producto

Categoría

Tiempo

TemporadaPrimavera - Verano

TemporadaOtoño - Invierno

día día

mes mes

año año

En el presente trabajo, he podido darme cuenta de la importancia de las bases de batos dentro de una organización y su relevancia para los altos directivos para la toma final de decisiones. Para la construcción de una base de datos en forma optima y clara, esta debe seguir todos sus procedimientos para un resultado final optimo y eficiente.

Lo que respecta al datawarehouse, es muy importante mencionar que esta herramienta, ayuda a disminuir los costos para la organización, además de mantener siempre el contacto de información entre empresas.

Finalmente me he dado cuenta que importante son las herramientas de la información en cada ámbito de la empresa y que estas deben ir de la mano con la comunicación debido a que este termino es muy nombrado, pero a la vez poco utilizado porque la clave es romper las barreras físicas, para llegar a la estructura interior la cual son las personas. Si no conquistamos la voluntad de las personas, no podemos asegurar el éxito empresarial. Preocuparse por la inteligencia y la voluntad de las personas que laboran en la empresa, es aportar por la excelencia en conjunto con el sistema de información a elaborar.

Como sistemas de información, creo fielmente que es un conjunto de recursos que se utilizan para gestionar, controlar y transmitir información dentro de una empresa u organización, es por tal motivo que desde hace varios años atrás, los sistemas de base de datos han ido reemplazando a los antiguos sistemas de información de las empresas, de modo que estos contengan muchos mas componentes en donde destaca la rapidez, fluidez y fácil interpretación de los datos a obtener.