class 51 olap.ppt

94
1 /96 /96 Mg. Samuel Oporto Díaz Almacenes de Datos INTELIGENCIA ARTIFICIAL

Upload: jesus-uchiha

Post on 15-Dec-2014

78 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Class 51 OLAP.ppt

11/96/96

Mg. Samuel Oporto Díaz

Almacenes de Datos

INTELIGENCIA ARTIFICIAL

Page 2: Class 51 OLAP.ppt

22/96/96

Tabla de Contenido• Introducción a la Inteligencia de Negocios• OLTP y OLAP• Metodología• Diseño Lógico• Diseño Físico• Principios de Diseño• Dimensiones• Cubos y medidas

Page 3: Class 51 OLAP.ppt

33/96/96

TOMA DE DECISIONES

Page 4: Class 51 OLAP.ppt

44/96/96

Toma de decisiones• Proceso de toma de decisiones:

Tomar decisiones sin la información adecuada, sobre todo cuando ésta se encuentra disponible en la organización, es un riesgo que ninguna empresa debería correr.

DecisiónMedición Control

Realidad

Page 5: Class 51 OLAP.ppt

55/96/96

Ejercicio 1• Forme grupos de 4 o 5 alumnos.• Defina un problema de decisión de su entorno inmediato.• La decisión debe ser tomada necesariamente por el grupo.• Debe ser un problema real.• Diga qué información requieren para tomar la decisión.• Diga en qué estado se encuentra, ¿debe procesarla?• Quién es el dueño de la información.• Qué variable controla con esta información.• Explique qué acciones tomará dependiendo del valor de la

variable, arme un grafo, un cuadro, un árbol de decisión.• Tome la decisión en la realidad.• Explique las consecuencias de su decisión.

Page 6: Class 51 OLAP.ppt

66/96/96

INTELIGENCIA DE NEGOCIOS

Page 7: Class 51 OLAP.ppt

77/96/96

Niveles en el Uso de los Datos

Page 8: Class 51 OLAP.ppt

88/96/96

Niveles en el uso de los datos• Nivel operacional: Se utilizan sistemas de información que

monitorean las actividades y transacciones elementales.

• Nivel de administración : Realiza operaciones repetitivas de captura masiva de datos y servicios básicos de tratamiento de datos, con tareas predefinidas.

• Nivel de conocimientos : Realiza actividades de análisis, de seguimiento, de control y toma de decisiones, realiza consultas sobre información almacenada.

• Nivel estratégico: Realizar las actividades de planificación a largo plazo, tanto del nivel de administración como de los objetivos que la empresa posee. Mira el futuro

Page 9: Class 51 OLAP.ppt

99/96/96

Uso de la información

Plazo Nivel Uso

Corto plazo Operacional y Administrativo

Obtención y control de datos

OLTP

Mediano plazo

De Conocimientos

Decisiones tácticas

OLAP

Largo plazo Estratégico Decisiones estratégicas

OLAP

OLTP (On-Line Transaction Processing - Procesamiento de Transacciones en Línea). Para la capturan y almacenamiento de transacciones.

OLAP (On-Line Analytical Processing – Procesamiento Analítico en Línea). Para el análisis y las navegación en los datos.

Page 10: Class 51 OLAP.ppt

1010/96/96

Inteligencia de Negocios

Business intelligence.• Conjunto de estrategias y herramientas enfocadas a la

administración y creación de conocimiento mediante el análisis de datos existentes en una organización o empresa.

• Características de las herramientas:– Accesibilidad a la información. Acceso de datos a los usuarios con

independencia de la procedencia de estos. – Apoyo en la toma de decisiones. Los usuarios tienen acceso a

herramientas de análisis que les permitan seleccionar y manipular sólo aquellos datos que les interesen.

– Orientación al usuario final. Independiente de los conocimientos técnicos de los usuarios y su capacidad para utilizar estas herramientas.

Page 11: Class 51 OLAP.ppt

1111/96/96

Inteligencia de Negocios

Business intelligence.• Es el conjunto de técnicas y herramientas que apoyan la

toma de decisiones.

• Características:1. Proveen información para el control del proceso de negocio,

independientemente de la fuente de los datos.2. Dan soporte a la toma de decisiones.3. Diferencia la información útil para los usuarios finales.4. Uniformiza los términos usados en la institución.

Independientemente del origen de los datos o de la forma de extracción, transformación y agregación.

Page 12: Class 51 OLAP.ppt

1212/96/96

Disciplinas• Enterprise Resource

Planning– ERP• Supply Chain

Management - SCM• Customer Relationship

Management. - CRM• Data Warehouses -

DW• Business Intelligence –

BI• Enterprise Application

Integration – EAI

Page 13: Class 51 OLAP.ppt

1313/96/96

Disciplinas• Data Warehousing: Se basa en estructuras

multidimensionales (cubos) que almacenan información calculada previamente de todas las combinaciones de todos los niveles de todas las aperturas de análisis. NxM.

• Data Mart: Es el almacén de datos de un hecho en particular.

• Data Mining: Es una técnica para la extracción de patrones y reglas desde los datos, ayuda a crear nuevos modelos no percibidos por el analista hasta ese momento pero que realmente existen en los datos.

Page 14: Class 51 OLAP.ppt

1414/96/96

Evolución• Business Data to Business Information

Etapa Pregunta del Negocio Tecnología disponible

Proveedores Características

Data Collection

(1960)

¿Cuál fue el total de ventas en Lima y en

Arequipa?

Computadoras, cintas, discos

IBM, NCR, etc Retrospectivo

Estático

Data Access (1980)

¿Cuáles fueron las ventas por sucursal en Lima y en Arequipa?

RDBMS SQL Oracle, Informix,

Sybase, etc Retrospectivo

binámico

Data Navigation

(1990)

¿Cuál fue el total de ventas en Lima?, Drill

DownOLAP DW

Pilot, Discoverer, Arbor,etc

Retrospectivo Dinámico Niveles

múltiples

Data Mining (2000)

¿Cómo evolucionarán las ventas en el próximo año?

Algoritmos avanzados,

Multiprocesadores

Intelligent Miner (IBM), SAS, etc

Prospectivo, Proactivo

Page 15: Class 51 OLAP.ppt

1515/96/96

Inteligencia de NegociosPlazo Técnica Tecnología Tecnología Conocimiento

Largo Plazo Minería de Datos Agrupamiento

Clasificación

Secuenciación

Reglas de asociación

Patrones

Nuevos Conocimientos

Mediano Plazo Data Warehouse OLAP Información

Toma de Decisiones

Corto Plazo Legacy Sistems (sistemas transaccionales)

OLTP Datos

Operativo

Page 16: Class 51 OLAP.ppt

1616/96/96

OLAP Y OLTP

Page 17: Class 51 OLAP.ppt

1717/96/96

OLTP y OLAP OLTP OLAP

Usuario Operativos, Profesionales TI Trabajadores de conocimiento

Uso Predecible, Repetitivo Ad hoc, Heurístico

Accesos Alta Media y baja

Tipo acceso R/W - actualización al campo Lectura - Sumarización

T. respuesta Segundos Segundos a minutos

Contenido Valores elementales Datos sumarizados, derivados

Estabilidad Dinámicos Estáticos hasta su actualización

Función Operaciones día a día Soporte a las decisiones

Diseño BD Orientado a la aplicación Orientado al tema (sujeto)

Estructura Transaccional (NORMALIZADA) Consultas (DESNORMALIZADA)

# filas cientos millones

# usuarios miles cientos

DB Size 100 MB-GB 100GB-TR

métrica rendimiento de la transacción rendimiento de la consulta

Page 18: Class 51 OLAP.ppt

1818/96/96

OLTP • On-Line Transaction Processing.• Sistemas operacionales que capturan transacciones y las

almacenan en Base de Datos.

• Características:– Transacciones en tiempo real (con día a día)– Datos almacenados cambian continuamente.– Mantienen los datos (INSER; DELETE;UPDATE)– Estructuras de datos optimizadas – normalizadas.– Basado en reglas.– Limitado para la toma de decisiones, las consultas

históricas producen un impacto en la operación del sistema.

– Usa Diagrama Entidad Relación (DER).

Page 19: Class 51 OLAP.ppt

1919/96/96

OLTP - EjemploOperación del Cliente:

• Tomar la tarjeta del Cliente.

• Validar el Cliente. si el Cliente existe confirmar que se encuentra en una línea de cajeros habilitada.

• Autenticar el cliente en el sistema.

Realizar una transferencia:

• Verificar que está autorizado para realizarla.

• Verificar que tiene saldo.

• Inicializar la transferencia manejándola como una transacción.

• Emitir comprobante.

• Saludar al Cliente.

Operación en sitio Web:

• Validar al cliente y autenticarlo en el sistema.

• Tomar el pedido.

• Controlar los topes de créditos.

• Informar los valores parciales de la compra y acumulados.

• Requerir confirmación del cliente antes de enviar el pedido.

• Enviar el pedido.

• Descontar del stock las cantidades vendidas.

• Informar el número de venta y la fecha de entrega.

• Saludar al cliente.

Sistema de Cajeros Automáticos.

Page 20: Class 51 OLAP.ppt

2020/96/96

OLAP• On-Line Analytical Processing.• Respuesta rápida y flexible a consultas, orientada al

análisis de datos.

• Características:– Optimizado para responder rápidamente a consultas.– Consulta interactiva de los usuarios.– Almacenan varios niveles de datos optimizadas para

responden a consultas.– Proporciona una vista de datos multidimensional.– Se puede cambiar fácilmente filas, columnas, y páginas

en informes de OLAP.

Page 21: Class 51 OLAP.ppt

2121/96/96

OLAP - Ejemplos• Sistemas de Información para

ejecutivos

– Alertas.

– Toma de decisiones.

• OLAP en la Actividad Financiera

– Reportes analíticos.

– Planeamiento.

– Análisis.

• OLAP en el Marketing

– Análisis de productos.

– Análisis de Clientes.

– Análisis de Facturación.

• OLAP en Otros Usos

– Análisis de la Producción.

– Análisis de Servicios al cliente.

– Evolución del Costo del producto.

Page 22: Class 51 OLAP.ppt

2222/96/96

OLAP - OLTP

OLTP Diagrama E-REntidad

Atributo

Relación

Normalización

Integridad Referencial

UML

Lenguaje de Modelamiento Unificado

Análisis

Diseño

Desarrollo

Implementación

Explotación

OLAP Cubos

Hechos

Dimensiones

Jerarquías

Medidas

Codificación

Granularidad

UDM

modelo dimensional unificado

Diseño

Carga

Explotación

Page 23: Class 51 OLAP.ppt

2323/96/96

Ejercicio 2• Responder las siguientes preguntas:

Page 24: Class 51 OLAP.ppt

2424/96/96

METODOLOGIA

Page 25: Class 51 OLAP.ppt

2525/96/96

Metodología

Page 26: Class 51 OLAP.ppt

2626/96/96

MetodologíaDefinición • Plantear los objetivos del

proyecto.• Definir los requerimientos del

negocio.• Modelar el negocio• Definir el plan de trabajo y

equipo de proyecto. Modelamiento • Comprender los requerimientos

del negocio.• Diseñar la arquitectura del DWH• Definir el equipo de pruebas.• Revisar el diseño

Construcción• Construir el DWH• Refinar los desarrollos del ETL• Probar la solución• Prueba de performance• Documentación Producción • Poner en operación del sistema• Validar y cargar la información

inicial• Administrar el crecimiento• Soporte de la solución.• Respaldar periodicamente la

información.

Page 27: Class 51 OLAP.ppt

2727/96/96

Ejercicio 3• Identifique metodologías para el desarrollo de DWH• Identifique metodologías para el desarrollo de SI• Compare las metodologías de desarrollo de DWH vs SI• Existen metodologías ágiles para el desarrollo de DWH

Page 28: Class 51 OLAP.ppt

2828/96/96

Ciclo de Vida del Proyecto

TechnicalArchitecture

Design

TechnicalArchitecture

Design

ProductSelection &Installation

ProductSelection &Installation

End-UserApplication

Specification

End-UserApplication

Specification

End-UserApplication

Development

End-UserApplication

Development

ProjectPlanningProject

Planning

Business

Requirement

Definition(week1)

Business

Requirement

Definition(week1)

DeploymentDeploymentMaintenance

andGrowth

Maintenanceand

Growth

Project ManagementProject Management

DimensionalModeling

DimensionalModeling Physical

DesignPhysicalDesign

Data StagingDesign &

Development

Data StagingDesign &

Development

Page 29: Class 51 OLAP.ppt

2929/96/96

DISEÑO LÓGICO

Page 30: Class 51 OLAP.ppt

3030/96/96

Diseño Lógico

Page 31: Class 51 OLAP.ppt

3131/96/96

Diseño Lógico• Esquema conceptual• Esquemas fuentes no integrados• Esquema fuente integrado• Esquema lógico intermedio• Esquema lógico del DWH

• Lineamientos de diseño• Mapeos• Reglas

• Transformaciones

Page 32: Class 51 OLAP.ppt

3232/96/96

Esquemas

Esquema conceptual

Esquema lógico

Esquema físico

Esquema visualización

lineamientos carga consultas

Esquema Fuente

Integrado

Esquema Intermedio

reglas de transformación

Page 33: Class 51 OLAP.ppt

Esquema conceptual• Especifica los requerimientos del usuario.

– Hechos, Dimensiones, Medidas

• Representa los objetos del negocio en términos de hechos, dimensiones, atributos de las dimensiones, cruces entre dimensiones, niveles de las dimensiones y medidas.

Page 34: Class 51 OLAP.ppt

3434/96/96

Esquemas fuentes• Define el origen de datos:

– Esquemas fuentes no integrados

– Esquema fuente integrado.

Page 35: Class 51 OLAP.ppt

3535/96/96

Esquema fuente intermedio• Define los cambios desde el esquema fuente integrado

hasta el esquema lógico del DWH

Page 36: Class 51 OLAP.ppt

3636/96/96

Esquema Lógico• La construcción del esquema lógico del DWH se lleva a

cabo mediante transformaciones aplicadas al esquema lógico de la base de datos fuente.

• Estas transformaciones se aplican a sub-esquemas relacionales, comenzando por el esquema fuente, generando como resultado el esquema lógico del DWH

• Especifica– El estilo de diseño del DH Copo de nieve o Estrella– Normalización de dimensiones– Fragmentación de datos

Page 37: Class 51 OLAP.ppt

3737/96/96

Modelos básicos dimensionales

Estrella Copo de Nieve

Page 38: Class 51 OLAP.ppt

3838/96/96

Esquema Físico• Existe tres formas de almacenar los datos:

.

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

DATOS AGREGACIONES

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

DATOS AGREGACIONES

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

ROLAP - Relacional OLAP. HOLAP - OLAP híbrido

MOLAP - Multidimensional OLAP.

Page 39: Class 51 OLAP.ppt

3939/96/96

Mapeos• Indican donde se encuentran en el esquema lógico fuente,

los elementos del esquema lógico conceptual.• Permiten asociar cada elemento.

Page 40: Class 51 OLAP.ppt

4040/96/96

Transformaciones• El diseño lógico del DW se realiza aplicando sucesivas

transformaciones de esquemas.• De deja una traza del diseño, de las transformaciones.

Page 41: Class 51 OLAP.ppt

4141/96/96

Transformaciones

Page 42: Class 51 OLAP.ppt

4242/96/96

Lineamientos de diseño• Abstrae la estrategia de diseño lógico del DWH y las

restricciones de desempeño y almacenamiento.• Define:

– El estilo de diseño del DH Copo de nieve o Estrella– Fragmentación vertical de dimensiones. Cuando normalizar o de-

normalizar una dimensión.• Estrella de-normaliza las dimensiones

• Copo de nieve normaliza las dimensiones

– Fragmentación horizontal de cubos.• Número de cubos para el datamart

• Cubos con datos históricos

– Mapeos• Estable la correspondencia entre esquemas

– Reglas

Page 43: Class 51 OLAP.ppt

4343/96/96

DISEÑO FÍSICO

Page 44: Class 51 OLAP.ppt

4444/96/96

MOLAP - OLAP Multidimensional• Los datos origen y sus agregaciones están en una

estructura multidimensional.• Los objetos dimensionales son procesados para incorporar

cambios de los datos operacionales• Existe latencia. tiempo comprendido entre procesamientos• Características:

– Provee excelente rendimiento y compresión de datos.

– Mejor tiempo de respuesta, depende de las las agregaciones.

– Estructura optimizada para maximizar las consultas.

– Apropiado para cubos de rápida respuesta.

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Page 45: Class 51 OLAP.ppt

4545/96/96

ROLAP - OLAP Relacional • La información del cubo, sus datos, su agregación, sumas

son almacenados en una base de datos relacional.• No copia la BD original, accede a las tablas origen.• Es más lenta que las otras estrategias (MOLAP o HOLAP).• Se utiliza para ahorrar espacio de almacenamiento en

grandes DB de baja frecuencia de consulta.• Usos comunes:

– Cuando los clientes desean ver los cambios inmediatamente. – Cuando contamos con grandes conjuntos de datos que no son

frecuentemente buscados

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

AGREGACIONES Y DATOS

Page 46: Class 51 OLAP.ppt

4646/96/96

HOLAP – OLAP Híbrido• Combina atributos de MOLAP y ROLAP. • Las agregaciones se almacenen en una estructura

multidimensional y los detalle, en la BD original.• Cubos más pequeños q’ MOLAP y más rápidos q’ ROLAP.• Usos comunes:

– Cubos que requieren rápida respuesta

– Cuando existen sumarizaciones basadas en una gran cantidad de datos de origen.

– Solución de compromiso para bajar el espacio ocupado sin perjudicar totalmente el rendimiento de las consultas.

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

DATOS AGREGACIONES

Base de Datos Relacional

Vista de Usuario

Base de Datos Multidimensional

DATOS AGREGACIONES

Page 47: Class 51 OLAP.ppt

4747/96/96

Características

  MOLAP ROLAP HOLAPAlmacenamiento de las Agregaciones

Modelo Multidimensional

Base de datos relacional

Modelo Multidimensional

Almacenamiento de los datos

Modelo Multidimensional

Base de datos relacional

Base de datos relacional

Facilidad de Creación

Sencillo Muy Sencillo Sencillo

Velocidad de respuesta

Buena Regular o Baja

Buena para consultas que posean agregaciones, Regular para datos de bajo nivel

EscalabilidadProblemas de escalabilidad

Son más escalables  

Recomendados para

Cubos con uso frecuente

Datos que no son frecuentemente usados

Si el cubo requiere una rápida respuesta

Page 48: Class 51 OLAP.ppt

4848/96/96

Ventajas y Desventajas

  Ventajas Desventajas

MOLAPMejor performance en los tiempos de respuesta

Duplica el almacenamiento de datos (ocupa más espacio)

    Tiempo de Latencia

ROLAP

Ahorra espacio de almacenamiento. Útil cuando se trabaja con muy grandes conjuntos de datos.

El tiempo de respuesta a consultas es mayor.

HOLAPBuen tiempo de respuesta sólo para información sumarizada

Volúmenes de datos más grandes en la base de datos relacional

Page 49: Class 51 OLAP.ppt

4949/96/96

Diseño Físico

query and reporting (Q&R) tool

Page 50: Class 51 OLAP.ppt

5050/96/96

PRINCIPIOS DE DISEÑO

Page 51: Class 51 OLAP.ppt

5151/96/96

Cubos

Page 52: Class 51 OLAP.ppt

5252/96/96

Conceptos de diseño1. Dimensión: Es una entidad de negocios respecto de la cual

se deben calcular las métricas. Ejemplos: clientes, productos, tiempo.

2. Dimension Table (tabla de dimensión): Tablas que almacenan las dimensiones.

3. Fact table (tabla de hechos): Almacena eventos (por ejemplo, las ventas). Contiene las métricas que miden la efectividad de las operaciones del negocio.Fact (hecho): Es una fila de la fact table. Representa un evento específico.

4. Measures (medidas): Valores cuantitativos que almacenan las métricas del negocio. Están representados por columnas numéricas en la fact table.

Page 53: Class 51 OLAP.ppt

5353/96/96

Page 54: Class 51 OLAP.ppt

5454/96/96

1. Dimensiones• Es un criterio utilizado para cruzar la información.

• La medida “Ventas”, por sí sola, carece de sentido. ¿Quiero ver las ventas por producto? ¿por tiempo? ¿por distribuidor?

• Cada uno de estos criterios produce una dimensión.

Page 55: Class 51 OLAP.ppt

5555/96/96

1. Dimensiones y niveles• Una dimensión tiene múltiples niveles de agrupación.

Por ejemplo, la dimensión “Ubigeo” debe poder disgregarse en países, departamentos, provincia, distrito.

• Cada uno de estos niveles de agregación define un nivel.• En el ejemplo antes mencionado, los niveles de la

dimensión “Ubigeo” son:. País

.. Departamento…Provincia….Distrito

• Cada nivel tiene ocurrencias. Por ejemplo, “Lima” es una ocurrencia del nivel Departamento. A estas ocurrencias se les llama miembros (members).

Page 56: Class 51 OLAP.ppt

5656/96/96

2. Tablas de dimensión• Las dimensiones se almacenan

en tablas.• Generalmente, cada nivel

representa una columna en la tabla de dimensión.

• Una tabla de dimensión posee una columna clave, comúnmente auto-generada.

• Una tabla de dimensión contiene columnas que almacenan los IDs de cada registro en sus sistemas de origen.

PRODUCTO_DIM

Producto_Key

IDProducto

Familia

Subfamilia

Marca

Presentación

Page 57: Class 51 OLAP.ppt

5757/96/96

3. Tabla de Hechos• La tabla de hechos es la tabla primaria del modelo

dimensional, y contiene los valores del negocio que se desea analizar.

• Cada tabla de hechos contiene las claves externas, que se relacionan con sus respectivas tablas de dimensiones, y las columnas con los valores que serán analizados.

• El modelo dimensional divide el mundo de los datos en dos grandes tipos: las medidas y las dimensiones de estas medidas.

• Las medidas, siempre son numéricas, se almacenan en las tablas de hechos y las dimensiones que son textuales se almacenan en las tablas de dimensiones.

Page 58: Class 51 OLAP.ppt

5858/96/96

4. Medidas• Son las columnas numéricas que queremos analizar que

provienen directamente de los sistemas OLTP.

• Cuando definimos una medida debemos tener en cuenta cual será la forma de agregación (agrupación de la misma) al subir por la estructura dimensional.

• Estas formas de agregación pueden ser:– Suma: es la operación que suma los valores de las columnas– Cuenta: realiza un conteo de los valores– Mínima: devuelve un valor mínimo– Máxima: proporciona el mayor de los valores– Cuenta de Distintos: cuenta los valores diferentes

Page 59: Class 51 OLAP.ppt

5959/96/96

Tabla de hechos y tablas de dimensión

La tabla de hechos tiene relaciones de foreign key con cada una de las tablas de dimensión

Page 60: Class 51 OLAP.ppt

6060/96/96

Esquemas de las Dimensiones• En el modelo STAR, cada nivel corresponde con una

columna adicional en una sola tabla de dimensión.

• En el modelo SNOWFLAKE, cada nivel corresponde con una nueva tabla de dimensión.

Page 61: Class 51 OLAP.ppt

6161/96/96

El modelo estrella (STAR)

Page 62: Class 51 OLAP.ppt

6262/96/96

Modelo SNOWFLAKE

Page 63: Class 51 OLAP.ppt

6363/96/96

Modelo STAR vs SNOWFLAKE

STAR SNOWFLAKE

Entendimiento del modelo

Sencillo Mayor dificultad

Número de tablas Menor Mayor

Complejidad de la consulta

Baja Alta

Desempeño de las consultas y el procesamiento del cubo

Rápida Lenta

Page 64: Class 51 OLAP.ppt

6464/96/96

Modelo STAR vs SNOWFLAKE

Page 65: Class 51 OLAP.ppt

6565/96/96

DIMENSIONES

Page 66: Class 51 OLAP.ppt

6666/96/96

Dimensiones• Las dimensiones se obtienen a partir de los criterios

utilizados por los usuarios para consultar las medidas.

• Si las ventas se miden por producto, tiempo y cliente; es posible que deba crear tres dimensiones: producto, tiempo y cliente.

Page 67: Class 51 OLAP.ppt

6767/96/96

Atributos• Un atributo representa una propiedad de interés en una

dimensión.

• Ejemplo: atributos de la dimensión Cliente:– Nombre cliente– Grado de instrucción– Nro de hijos– Ciudad– País

• Cada atributo proviene de una columna de la tabla de dimensión.

Page 68: Class 51 OLAP.ppt

6868/96/96

Jerarquías y niveles• Existen en una empresa entidades de negocio que admiten

más de una interpretación.

• Por ejemplo: puedo analizar a los clientes por ubicación geográfica, grado de instrucción, sexo, número de hijos, etc.

• Por cada manera distinta de analizar la información de una dimensión, se crea una nueva jerarquía.

• Cada jerarquía contiene su propia estructura de niveles. Cada nivel proviene de un atributo.

Page 69: Class 51 OLAP.ppt

6969/96/96

Ejercicio 4• Se desea obtener indicadores de rendimiento de los

empleados de la corporación.• Los reportes de evaluación de los empleados deben ser

totalizados de acuerdo a las divisiones organizacionales y regiones geográficas de la corporación.

• Cada empleado trabaja para una división organizacional. A su vez, cada empleado pertenece a una ciudad, y cada ciudad está contenida en una región.

• ¿Cuál es la manera de definir los niveles de la dimensión Empleado?

Page 70: Class 51 OLAP.ppt

7070/96/96

Solución• Crear dos jerarquías: Región y División.

Empleado.Región

▪ Región

▪▪ Ciudad

▪▪▪ Empleado

Empleado.División

▪ División

▪▪ Empleado

Page 71: Class 51 OLAP.ppt

7171/96/96

Miembros de una dimensión• Cada miembro es una

ocurrencia específica de una dimensión.

• Las dimensiones suelen tener una estructura basada en niveles. Cada miembro se ubica en un determinado nivel.

Page 72: Class 51 OLAP.ppt

7272/96/96

Relaciones entre los miembros• Austria es el padre (parent) de

Graz y Salzburg.• Austria y Belgium son hermanos

(siblings).• Graz y Salzburg son hermanos

(siblings).• Graz y Salzburg son hijos

(children) de Austria.• Los ancestros (ancestors) de

Graz son Ubigeo y Austria.• Los descendientes

(descendants) de Ubigeo son todos los miembros de la dimensión (Argentina, Austria, Graz, Salzburg, etc.)

• Graz y Salzburg son primos (cousin) de Bruxelles y Charleroi.|

Page 73: Class 51 OLAP.ppt

7373/96/96

Tipos de dimensiones

1. Dimensiones estándar

2. Dimensiones Time

3. Dimensiones Padre - Hijo

Page 74: Class 51 OLAP.ppt

7474/96/96

Dimensiones estándar• Es el tipo más sencillo de dimensión.• Una dimensión estándar tiene un conjunto fijo de jerarquías

y niveles, establecido por el diseñador a través de SSBIDS.

• Propiedades:– Name: Nombre de la dimensión.– Usage: Uso que se dará a la dimensión.– KeyColumns: Columna(s) de clave para la dimensión.– NameColumn: Columna que proporciona el valor

mostrado en la dimensión al consultar datos.

Page 75: Class 51 OLAP.ppt

7575/96/96

Dimensiones Parent – Child• Se basan en relaciones

recursivas existentes en una tabla de dimensión.

• Por ejemplo, un empleado tiene un jefe. Pero este jefe es también un empleado.

Page 76: Class 51 OLAP.ppt

7676/96/96

Dimensiones Parent – Child• Las dimensiones Parent –

Child contienen un número variable de niveles.

• En la figura, Ken Sánchez es el jefe de Brian Welcker y David Bradley.

• Ejemplos típicos: jerarquías de mando, organigramas.

Page 77: Class 51 OLAP.ppt

7777/96/96

Dimensión Time• El tiempo es parte implícita

de la información que contiene el data mart.

• Esta dimensión la podemos definir separándola en distintas jerarquías de tiempo:

• Año• Semestre • Mes

Page 78: Class 51 OLAP.ppt

7878/96/96

CUBOS Y MEDIDAS

Page 79: Class 51 OLAP.ppt

7979/96/96

Cubos

Page 80: Class 51 OLAP.ppt

8080/96/96

Propiedades de los cubos• Name: Nombre del cubo.• Visible: Determina si el cubo es visible o no.• Default Measure: La medida devuelta por el cubo en caso

de que las consultas no especifiquen de forma explícita qué medida se desea visualizar.

• Medida: representa un valor obtenido a partir de una columna numérica de la tabla de hechos.

• Grupo de medidas (measure group): Las medidas se agrupan en grupos de medidas (grupo de medidas). Cada grupo de medidas corresponde con una tabla de hechos. Un cubo puede contener varios grupo de medidas.

Page 81: Class 51 OLAP.ppt

8181/96/96

Propiedades de las medidas• Name: Nombre de la medida.• Description: Descripción de la medida.• Source: Columna de la tabla de hechos a partir de la cual

se obtiene la medida. • Format String: Determina el formato de visualización de la

medida (por ejemplo, porcentaje y moneda). También permite ingresar una cadena de formato personalizada.

• Visible: Determina si la medida es visible o no. Esta propiedad es útil cuando se definen medidas intermedias, a partir de las cuales se calcularán otras medidas a través de MDX.

• Data Type: Tipo de dato de la medida. Por defecto, es heredado del tipo de dato de la columna que genera la medida.

Page 82: Class 51 OLAP.ppt

8282/96/96

Función de agregación• SUM: Es por defecto. Significa que el valor de la medida para un

miembro de una dimensión es igual a la suma de los valores para todos sus miembros hijos.

• COUNT: Recupera la cuenta de registros en la tabla de hechos. • MIN: Significa que el valor de la medida para un miembro es igual al

valor mínimo encontrado entre sus miembros hijos.• MAX: Significa que el valor de la medida para un miembro es igual al

valor máximo encontrado entre sus miembros hijos.• DISTINCT COUNT: Recupera la cuenta de registros en la tabla de

hechos, eliminando las ocurrencias repetidas.• NONE: No se efectúa ningún tipo de agregación• BY ACCOUNT: Agrega la medida de acuerdo con la función de

agregación asignada a las dimensiones de tipo “Account”.

Page 83: Class 51 OLAP.ppt

8383/96/96

Función de agregación• AVERAGE OF CHILDREN: Significa que el valor de la medida para un

miembro de una dimensión es igual al promedio de los valores para todos sus miembros hijos no vacíos.

• FIRST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo.

• LAST CHILD: Significa que el valor de la medida para un miembro es igual al valor de la medida para su último miembro hijo.

• FIRST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su primer miembro hijo no vacío.

• LAST NON EMPTY: Significa que el valor de la medida para un miembro es igual al valor de la medida para su último miembro hijo no vacío.

Page 84: Class 51 OLAP.ppt

8484/96/96

Relaciones entre las dimensiones hechos• Regular• Referenciada• Fact• Many – to – many

Page 85: Class 51 OLAP.ppt

8585/96/96

1. Relación regular• Relación uno – muchos con la tabla de hechos.

Page 86: Class 51 OLAP.ppt

8686/96/96

Roles de las dimensiones• En ocasiones, una dimensión participa múltiples veces en

el mismo cubo, desempeñando distintos roles.• Ejemplos:

– Una tabla de hechos puede contener tres columnas que lo enlacen con la dimensión de tiempo: una columna para almacenar la fecha de facturación, otra para almacenar la fecha de remisión, y otra para almacenar la fecha de entrega.

– Una tabla de hechos puede contener dos columnas enlazadas con la dimensión de empleados: una columna para representar al empleado que efectuó la venta, y otra para representar al empleado que efectuó el despacho.

Page 87: Class 51 OLAP.ppt

8787/96/96

Roles de las dimensiones

Page 88: Class 51 OLAP.ppt

8888/96/96

2. Relación referenciada• Se produce cuando la tabla de dimensión no está

directamente relacionada con la tabla de hechos.

Page 89: Class 51 OLAP.ppt

8989/96/96

2. Relación referenciada

Page 90: Class 51 OLAP.ppt

9090/96/96

3. Relación “Fact”• Frecuentemente, las tablas de hechos contienen, además

de columnas de medidas y foreign keys, columnas adicionales que almacenan información relevante para el negocio.

• En estas situaciones, puede resultar muy útil definir una dimensión a partir de la tabla de hechos. A este tipo de dimensiones se les denomina “dimensiones degeneradas”.

Page 91: Class 51 OLAP.ppt

9191/96/96

3. Relación “Fact”• La columna

“SalesOrderNumber” almacena el número del documento de orden de venta.

• Esta información puede ser usada para definir una dimensión.

Page 92: Class 51 OLAP.ppt

9292/96/96

4. Relación Muchos – Muchos• Implementan relaciones muchos – muchos entre tabla de

hechos y tabla de dimensión.

Page 93: Class 51 OLAP.ppt

9393/96/96

4. Relación Muchos – Muchos• Ejemplos:

– Un motivo de venta (tabla de dimensión) puede tener muchas ventas (tabla de hechos). Una venta específica, a su vez, puede tener muchos motivos.

– La misma ausencia laboral puede deberse a múltiples razones. Cada razón tiene varias ausencias relacionadas.

• Estas relaciones se implementan a través de una tabla de hechos intermedia.

Page 94: Class 51 OLAP.ppt

9494/96/96

4. Relación Muchos – Muchos