data warehouse

15
DATA WAREHOUSE

Upload: anyeni-garay

Post on 26-Jul-2015

198 views

Category:

Engineering


4 download

TRANSCRIPT

Page 1: Data warehouse

DATA WAREHOUSE

Page 2: Data warehouse

Introducción

Tras las dificultades de los sistemas tradicionales en satisfacer las necesidades informacionales, surge el concepto de Data Warehouse, como solución a las necesidades informacionales globales de la empresa. Este término acuñado por Bill Inmon, se traduce literalmente como Almacén de Datos. No obstante si el Data Warehouse fuese exclusivamente un almacén de datos, los problemas seguirían siendo los mismos que en los Centros de Información.

Page 3: Data warehouse

¿Qué es un Data Warehouse?Un Data Warehouse es esencialmente un bodega

de datos, una colección de datos orientada a un determinado ámbito (empresa, organización, etc.), integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de una organización, más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en línea). 

Page 4: Data warehouse

Características de un Data WareHouseIntegrado: los datos almacenados en el Data

Warehouse deben integrarse en una estructura consistente.

Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional.

Histórico: el tiempo es parte implícita de la información contenida en un Data Warehouse.

No volátil: el almacén de información de un Data Warehouse existe para ser leído, y no modificado.

Page 5: Data warehouse

Objetivos fundamentalesHace que la información de la organización

sea accesibleHacer que la información de la organización

sea consistenteEs información adaptable y elásticaEs un seguro baluarte que protege los

valores de la informaciónEs la fundación de la toma de decisiones

Page 6: Data warehouse

Elementos básicos Sistema fuente Área de tráfico de datos Servidor de presentación Modelo dimensional Procesos de negocios Data Mart Almacenamiento operacional de datos OLAP ROLAP MOLAP Aplicaciones para usuarios finales Herramientas de acceso a datos por usuarios finales Ad Hoc QueryTool Modelado de aplicaciones Meta Data

Page 7: Data warehouse

Procesos básicos del Data WareHouse (ETL)

Extracción: este es el primer paso de obtener la información hacia el ambiente del Data WareHouse.

Transformación: una vez que la información es extraída hacia el área de trafico de datos, hay posibles paso de transformación como; limpieza de la información, tirar la basura lo que no nos sirve, seleccionar únicamente los campos necesarios para el Data WareHouse.

Carga: al final del proceso de transformación, los datos están en forma para ser cargados.

Page 8: Data warehouse
Page 9: Data warehouse

Diferencias entre un Data WareHouse y un sistema tradicional

SISTEMA TRADICIONAL DATA WAREHOUSE Predomina la actualización Predomina la consulta• La actividad más importante es de

tipo operativo (día a día)  La actividad más importante es el

análisis y la decisión estratégica

Predomina el proceso puntual • Predomina el proceso masivo• Mayor importancia a la estabilidad Mayor importancia al dinamismo

• Datos en general desagregados   • Datos en distintos niveles de detalle y

agregación

• Importancia del dato actual • Importancia del dato histórico• Importante del tiempo de respuesta

de la transacción instantánea

Importancia de la respuesta masiva

Estructura relacional Visión multidimensional

Usuarios de perfiles medios o bajos • Usuarios de perfiles altos

• Explotación de la información relacionada con la operativa de cada aplicación

  

Explotación de toda la información interna y externa relacionada con el negocio

Page 10: Data warehouse

Ventajas Proporciona una herramienta para la toma de decisiones en cualquier área

funcional, basándose en información integrada y global del negocio. Facilita la aplicación de técnicas estadísticas de análisis y modelización para

encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.

Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.

Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.

Especialmente útil para el medio y largo plazo. Son sistemas relativamente sencillos de instalar si las fuentes de datos y los

objetivos están claros. Muy útiles para el almacenamiento de análisis y consultas de históricos. Permite una mayor flexibilidad y rapidez en el acceso a la información. Proporciona una comunicación fiable entre todos los departamentos de la

empresa. Transforma los datos en información y la información en conocimiento. Data warehouse proporciona una información de gestión

accesible, correcta, uniforme y actualizada. Proporciona un menor coste en la toma de decisiones, una mayor flexibilidad

ante el entorno, un mejor servicio al cliente y permite el rediseño de los procesos.

 

Page 11: Data warehouse

Desventajas No es muy útil para la toma de decisiones en tiempo real debido al largo

tiempo de procesamiento que puede requerir. En cualquier caso la tendencia de los productos actuales (junto con los avances del hardware) es la de solventar este problema convirtiendo la desventaja en una ventaja.

Requiere de continua limpieza, transformación e integración de datos. Mantenimiento. En un proceso de implantación puede encontrarse dificultades ante los

diferentes objetivos que pretende una organización. Una vez implementado puede ser complicado añadir nuevas fuentes de

datos. Requieren una revisión del modelo de datos, objetos, transacciones y

además del almacenamiento. Tienen un diseño complejo y multidisciplinar. Requieren una reestructuración de los sistemas operacionales. Tienen un alto coste. Requieren sistemas, aplicaciones y almacenamiento específico. 

Page 12: Data warehouse

Las razones básicas de porque una organización implementa Data WareHouse

Para realizar tareas en los servidores y discos, asociados a queries y reportes en servidores y discos que no son utilizados por sistemas de proceso de transacciones.

Para utilizar modelos de datos o tecnologías de servidores que agilizan los queries y reportes, y que no son apropiados para los procesos de transacciones.

Para proveer un ambiente donde relativamente una muy poca cantidad de conocimiento de los aspectos técnicos de tecnología de bases de datos es requerida para escribir y mantener queries y reportes. 

Para proveer un repositorio del sistema de proceso de transacciones limpio que puede ser reportado y que no necesariamente requiere que se arregle el sistema de proceso de transacciones. 

Para hacer los queries y reportes de datos básicamente más fácil de los múltiples procesos de transacciones y de las fuentes externas y de los datos que deben ser almacenados solamente para el propósito de hacer queries y reportes.

Page 13: Data warehouse

Ejemplo

Page 14: Data warehouse

CONCLUSIONESData WareHouse es la integración de datos consolidados, almacenados

en un dispositivo de memoria no volátil, proveniente de múltiples y posiblemente diferentes fuentes de datos. Con el propósito del análisis y a partir de este tomar decisiones en función de mejorar la gestión del negocio.

El Data WareHouse hace que la información de la organización sea consistente: la información de una parte de la organización puede hacerse coincidir con la información de la otra parte de la organización.

Comprende información adaptable y elástica; el Data WareHouse está diseñado para cambios continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos existentes y las tecnologías no cambian ni se corrompen.

Es el almacenamiento de datos históricos para analizarlos y utilizarlos en la toma de decisiones futuras.

Page 15: Data warehouse

GRACIAS