bases de datos ii olap online analytical processing
DESCRIPTION
Bases de Datos II OLAP Online Analytical Processing. Elaborado por: Guillermo Baquerizo I Término 2012-2013. Objetivos. El estudiante será capaz de aprender : el propósito del procesamiento analítico en línea . - PowerPoint PPT PresentationTRANSCRIPT
Elaborado por: Guillermo BaquerizoI Término 2012-2013
Bases de Datos IIOLAP
Online Analytical Processing
ObjetivosEl estudiante será capaz de aprender:
el propósito del procesamiento analítico en línea.
las relaciones entre OLAP y los almacenes de datos (DATA WAREHOUSE).
las características clave de las aplicaciones OLAP.
cómo representar cubos multidimensionales.las categorías de las herramientas OLAP.
ConceptosOLAP.- Se refiere a la síntesis, análisis y
consolidación de grandes volúmenes de datos multidimensionales. Es una solución utilizada en el campo BI (Business Intelligence), para lo cual utiliza cubos de información y puede ser utilizado en DATA MINING (Minería de Datos).
ConceptosLas bases de datos relacionales se utilizan
principalmente para soportar sistemas de procesamiento de transacciones en línea (OLTP, Online Transaction Processing).
Los DBMS (DataBase Management System) relacionales se han desarrollado para permitir la ejecución eficiente de un gran número de transacciones relativamente simples.
ConceptosLos DBMS relacionales han tratado de
dirigirse al mercado de los almacenes de datos y han promocionado sus sistemas como herramientas para construir este tipo de almacenes.
Para consultas más avanzadas se requiere el OLAP.
Esquema
ETL
ExtractionTransformatio
nLoading
Sistemas Operacional
es
Metadatos
Datos resumidos
ERP
CRM
Archivosplanos Data WareHouse
OLAP
Reportes
Minería de datos
AplicacionesÁrea funcional
Ejemplos de aplicaciones OLAP
Finanzas Presupuestos, desgloses de costos por actividad, análisis de rendimiento financiero y modelado financiero.
Ventas Análisis de ventas y previsiones de ventas.
Marketing Análisis de investigación de mercados, previsiones de ventas, análisis de promociones, análisis y segmentación de clientes.
Fabricación Planificación de la producción y análisis de defectos.
Cubos multidimensionalesConsidere un ejemplo con los datos
multidimensionales vistos desde:Una tabla de 3 camposUna matriz bidimensionalUn cubo tridimensional
CategoríasLas herramientas OLAP pueden clasificarse
de acuerdo con la arquitectura utilizada para almacenar y procesar los datos multidimensionales. Hay cuatro categorías principales:MOLAPROLAPHOLAPDOLAP
OLAP Multidimensional (MOLAP)Las estructuras de datos MOLAP utilizan
tecnología matricial y técnicas eficientes de almacenamiento que minimizan las necesidades de espacio en disco, gracias a la gestión de datos dispersos.
Se suelen centrar en datos para una aplicación específica de ayuda a la toma de decisiones.
OLAP Multidimensional (MOLAP)Problemas:
Sólo pueden almacenarse y analizarse de manera eficiente una cantidad limitada de datos.
La navegación y el análisis de los datos están limitados, porque los datos se diseñan de acuerdo a requisitos previamente determinados.
Los productos MOLAP requieren un conjunto diferente de capacidades y herramientas para construir y mantener la base de datos, incrementándose el costo y la complejidad de las tareas de soporte.
OLAP Multidimensional (MOLAP)
Servidor de base de datos relacional y/o sistemas
heredados
Carga
Servidor MOLAP Solicitud de datos
Herramientas de acceso de
usuario final
Conjunto de resultados
OLAP Relacional (ROLAP)Soportan los productos RDBMS mediantes el
uso de un nivel de metadatos, evitando así la necesidad de crear una estructura de datos mutidimensional estática. Esto facilita la creación de múltiples vistas multidimensionales de la relación bidimensional.
Para mejorar las prestaciones, algunos productos ROLAP disponen de motores SQL mejorados para soportar la compeljidad del análisis multidimensional.
OLAP Relacional (ROLAP)Problemas:
Rendimiento asociado con el procesamiento de consultas complejas que requieran efectuar múltiples pasadas a través de los datos relacionales.
Desarrollo de middleware para facilitar el desarrollo de aplicaciones multidimensionales, es decir, software que convierta la relación bidimensional en una estructura multidimensional.
Desarrollo de una opción para crear estructuras multidimensionales persistentes, junto con las funciones para ayudar en la administración de estas estructuras.
OLAP Relacional (ROLAP)
Servidor de base de datos relacional
Conjunto de resultados
Servidor ROLAP Solicitud de datos
Herramientas de acceso de
usuario final
Conjunto de resultados
SQL
OLAP híbrido (HOLAP)Proporcionan capacidades limitadas de
análisis, bien sobre productos SGBDR o bien utilizando un servidor MOLAP intermedio.
Las herramientas HOLAP suministran a la máquina de escritorio los datos seleccionados en la forma de un cubo de datos, el cual se almacena, analiza y mantiene localmente.
OLAP híbrido (HOLAP)Problemas:
La arquitectura provoca una significativa redundancia de los datos y puede causar problemas en las redes que soporten muchos usuarios.
La capacidad de cada usuario para construir un cubo de datos personalizado puede provocar una falta de coherencia entre los datos de los diferentes usuarios.
Sólo puede mantenerse de manera eficiente una cantidad limitada de datos.
OLAP híbrido (HOLAP)Servidor de base de datos
relacional
Carga
Servidor MOLAP
Solicitud de datos
Conjunto de resultados
Herramientas de acceso de
usuario final
SQL
Conjunto de resultados
OLAP de Escritorio (DOLAP)Almacenan los datos OLAP en archivos
situados en la plataforma del cliente y soportan el procesamiento multidimensional del lado del cliente.
Estos datos pueden distribuirse por adelantado o bajo petición, posiblemente a través de la web.
Aunque también se pueden mantener en el disco o la RAM, algunos productos DOLAP sólo permiten acceso de lectura.
OLAP de Escritorio (DOLAP)Problemas:
Provisión de controles de seguridad apropiados para soportar todos los entornos.
Hace falta reducir el esfuerzo necesario para implantar y mantener las herramientas DOLAP.
Las formas existentes son: correo electrónico, web o la tradicional arquitectura cliente-servidor.
Las tendencias actuales apuntan hacia la utilización de máquinas cliente simples.
OLAP de Escritorio (DOLAP)Servidor de base de datos
relacional
Servidor MOLAP
La distribución de los datos OLAP desde una base de datos
relacional o desde un servidor MOLAP hasta el PC de
escritorio o portátil se realiza utilizando
correo electrónico, la web o una
arquitectura tradicional cliente-
servidor.
Extensiones al lenguaje SQLSe pueden realizar cálculos utilizando
agregación del tipo de SUM, COUNT, MAX, MIN, AVG
Capacidades de agrupamiento ampliadas:Rollup: Niveles crecientes de agregación
desde el más detallado hasta el más general. La instrucción es:
SELECT … GROUP BY (ListaDeColumnas) WITH ROLLUP
Cube: Similar a Rollup, pero permite todas las posibles combinaciones de agregaciones.
La instrucción es: SELECT … GROUP BY (ListaDeColumnas) WITH
CUBE