datamart y mineria

5
Practica #3. Data Mart y Minería de Datos Carrito de Compra de Tienda Online Se entiende por el término DataMart que es una base de datos departamental, que se especializa en el almacenamiento de los datos de un área de negocio de forma específica. Se caracteriza por poder analizar la información a detalle desde las diferentes perspectivas que puedan afectar los procesos de los departamentos. Mientras que un datawarehouse permite la concentración de varias bases de datos, para poder trabajar con ellas de forma óptima. Se establece un marco de trabajo, donde existen cuatro departamentos básicos con lo que cuenta la empresa, que es una tienda online dedicada a la venta de artículos de marca, los cuales son: Almacén Inventario Envíos Compras Donde cada uno cuenta con su administración propia y su información propia, por lo que no es conveniente juntar la información de todas, puesto que tendería a revolverse, además de no llevar un orden y control sobre la información que se está manejando. Más sin embargo no se deberá de olvidar que cada uno de ellos deberá estar ligado de forma continua ya que así lo requiere. Mientras que por otra parte habrán otros datamart que se ocupen de la parte financiera del negocio, de la parte de mercadeo, ventas y también trabaje sobre y con recursos humanos. Por lo tanto en la imagen siguiente se muestra un diagrama donde se puede observar la distribución de forma generalizada de las partes que controlara cada uno de los datamart y por ende pertenecen a la empresa.

Upload: any-acosta

Post on 04-Aug-2015

44 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Datamart y Mineria

Practica #3. Data Mart y Minería de Datos

Carrito de Compra de Tienda Online

Se entiende por el término DataMart que es una base de datos departamental, que se especializa en el almacenamiento de los datos de un área de negocio de forma específica. Se caracteriza por poder analizar la información a detalle desde las diferentes perspectivas que puedan afectar los procesos de los departamentos.

Mientras que un datawarehouse permite la concentración de varias bases de datos, para poder trabajar con ellas de forma óptima. Se establece un marco de trabajo, donde existen cuatro departamentos básicos con lo que cuenta la empresa, que es una tienda online dedicada a la venta de artículos de marca, los cuales son:

Almacén Inventario Envíos Compras

Donde cada uno cuenta con su administración propia y su información propia, por lo que no es conveniente juntar la información de todas, puesto que tendería a revolverse, además de no llevar un orden y control sobre la información que se está manejando.

Más sin embargo no se deberá de olvidar que cada uno de ellos deberá estar ligado de forma continua ya que así lo requiere. Mientras que por otra parte habrán otros datamart que se ocupen de la parte financiera del negocio, de la parte de mercadeo, ventas y también trabaje sobre y con recursos humanos.

Por lo tanto en la imagen siguiente se muestra un diagrama donde se puede observar la distribución de forma generalizada de las partes que controlara cada uno de los datamart y por ende pertenecen a la empresa.

Page 2: Datamart y Mineria

Donde las ventajas que se obtendrán al trabajar con datamart es obtener:

Volumen de datos reducidos Consultas más rápidas Consultas son sencillas Validación directa de la información Facilidad de historización de los datos.

Modelado Multidimensional

Al llevar a cabo la realización de una base de datos multidimensional, se debió haber realizado un análisis sobre las dimensiones que deberá contener nuestro cubo, haciendo mención que se pueden crear las dimensiones que sean necesarias, y tomando en cuenta que también se pueden obtener ciertos resultados cuando los datos no se encuentran precisamente en filas o columnas de alguna de las dimensiones del cubo se llaman paginadas las cuales permiten determinar los datos que aparecerán en las tablas posteriormente, como en las figuras que se muestran que es solo una parte del análisis.

Page 3: Datamart y Mineria

Por lo tanto las dimensiones del cubo a generar quedarían de la siguiente forma.

Área financiera Área Recursos Humanos Área Marketing y ventas

Donde el área financiera será el encargado de almacenar, generar administrar y definir los costos de los productos que ofrece la tienda online, como también otra de sus grandes ramas será la obtención de presupuestos de las campañas

publicitarias que se tendrán que llevar a cabo para lograr las ventas establecidas, en las diferentes proyecciones realizadas de forma financiera, entre otras de sus tareas.

Para el área de marketing y ventas se encarga de almacenar la información sobre los productos que se ofrecen además de estar recopilando la información importante o no sobre cómo se comporta cierto o varios productos, cuando han sido introducidos al mercado, con el fin de determinar fechas fuertes de ventas o demanda de los productos, así como las temporadas más bajas, para ofrecer mayor ofertas y promociones al consumidor con el fin de generar más ganancias.

Mientras que para el área de recursos humanos para almacenar y recopilar la información del personal que pertenece a la empresa en el ámbito laborar, con el fin de mantener datos actualizados, además de almacenar comportamiento, rendimiento, entre otros aspectos que son importantes para la empresa conocer.

Pentaho kettle Project

Se escogió esta herramienta de pentaho ya que nos va a ayudar a la Integración de datos que ofrece una potente extracción y capacidades de transformación y carga (ETL) utilizando un enfoque innovador, basada en metadatos. Con un arrastre intuitiva y gráfica y entorno de diseño de gota y una arquitectura probada, escalable y basada en estándares, integración de datos.

Admite software de código abierto. También está disponible un Enterprise Edition ((EE)) de integración de datos de Pentaho incluye soporte técnico, actualizaciones administradas y características de la empresa. Para obtener más información acerca de EE o de imágenes y hojas de datos.

Integración de datos de Pentaho

Page 4: Datamart y Mineria

Funcionalidad de salida para controlar la apariencia.

Gráfico comentarios de rendimiento y progreso para las transformaciones

Permite la descarga de estadísticas.

Permite ejecutar los informes con parámetros en una transformación, permite el fácil informe

estallido de informes personalizados.

Obtener repositorio nombres paso recupera información de empleo y la transformación de los

repositorios.

Con la información que se obtendrá de los puntos anteriores se pretende tener la información más

relevante la cual nos llevara a tener una buena toma de decisiones con la cual podemos realizar

estadísticas tanto de lo financiero, marketing y los recursos humanos. Con esto la empresa deberá

asegurar que tendrá éxito en sus proyectos y en caso de que haya alguna baja poder detectarla a

tiempo y así ajustar los engranes necesarios antes de llevarlo a la práctica y resulte con gran éxito esta

toma de decisiones.

A estos se refiere con, la obtención de las ventas generadas de forma mensual, diaria, o semanal,

producto que se ha quedado en almacén, cantidad de productos que se surtieron stocks tanto máximos

como mínimos, entre otros.

Para recursos humanos, datos importantes son la antigüedad, cargo, tareas a realizar, asistencia, entre

otros.

Estas se podrán ver reflejadas en los estados financieros, líneas del tiempo, estadísticas, graficas entre

otros.