la habilidad de acceder a los datos de la toda la empresa la habilidad de tener consistencia en los...
TRANSCRIPT
• La habilidad de acceder a los Datos de la toda la Empresa
• La habilidad de tener consistencia en los datos
• La habilidad de realizar un análisis
¿Porqué construir una base de datos?¿Porqué construir una base de datos?
• Reportes en Papel• Análisis en Planilla de Cálculo • Sistemas de información ejecutiva• Herramientas estándar Data Warehouse
Historia de análisis de los Historia de análisis de los datos corporativos datos corporativos
• Sistemas OLAP
• Sistemas OLTP
• OLAP vs. OLTP
• Consistencia y Consolidación
• Información Significativa
• Histórica
• Solo lectura
• Granularidad
¿Qué es un Data ¿Qué es un Data Warehouse?Warehouse?
• Herramientas para los Usuarios
• Colección de Datos para asistir el soporte de decisión
• Datos y Herramientas
• El Data Warehouse es para los Datos de toda la empresa
• Un Data Mart es específico a un departamento en particular
• ¿Por que construir Data Marts?
¿Qué es un Data Mart?¿Qué es un Data Mart?
• Ventajas de Data Marts sobre Data Warehouse
• Desventajas en la construcción de Data Marts
Data Marts vs. Data Marts vs. Data WarehouseData Warehouse
• Construir de Warehouse por integración de Data Marts a través de la Empresa
• Construcción de Data Marts a partir del Data Warehouse
Construyendo un Data Construyendo un Data Warehouse o Data MartWarehouse o Data Mart
DatosDatos Warehouse Warehouse
Ventas Ventas MartMart
Finanzas Finanzas
Mart Mart
Servicio al Servicio al Cliente Cliente Mart Mart
Fuente 1
Fuente 2Fuente 2
Fuente 3Fuente 3
Ventas Ventas MartMart
Finanzas Finanzas Mart Mart
Data Data WarehouseWarehouse
Servicio al Servicio al ClienteClienteMart Mart
Fuente Fuente 1
Fuente 2Fuente 2
Fuente 3Fuente 3
FuenteFuente 1 Fuente 2Fuente 2 Fuente 3Fuente 3
Producto
Localización
OrganizaciónGL
Finanzas
Ventas
Tiempo
Clientes
Integración de Data MartsIntegración de Data Marts
El ciclo de vida de los Datos El ciclo de vida de los Datos WarehousingWarehousing
Entorno TecnológicoEntorno Tecnológico
• Servicio de Transformación de Datos
• Servicios OLAP de Servidores SQL
• Requerimientos de Consulta en Inglés
• Servicio de Tabla de Pivot
Servidor SQL Herramientas de Servidor SQL Herramientas de Data WarehouseData Warehouse
• Soporte avanzado de base de datos
Escenarios de NegociosEscenarios de Negocios
• Búsqueda de Ventas
• Partes Buscadas
Búsqueda de VentaBúsqueda de Venta
• Dimensiones
• Metas
Terminología de Data Terminología de Data WarehousingWarehousing
• Cubo• Data Mart• Data Warehouse• Meta Datos• OLAP• OLTP• Sistema Fuente de Datos• Transformaciones
Comparación de Arquitecturas Comparación de Arquitecturas de Sistemasde Sistemas
• Sistemas Operacionales
• Sistemas Analíticos
¿Dónde, Qué, Cómo ¿Dónde, Qué, Cómo es ahora?es ahora?
• Operacional
Respondiendo y Solicitando eventos individuales
• Analíticos
Estudiando (Midiendo) múltiples eventosy respuestas a través de las áreas y tiempo funcionales
Objetivos de NegociosObjetivos de NegociosObjetivos de NegociosObjetivos de Negocios
Necesidad de Análisis de Informaciones más altasNecesidad de Análisis de Informaciones más altasNecesidad de Análisis de Informaciones más altasNecesidad de Análisis de Informaciones más altas
Procedimientos y rolesProcedimientos y rolesProcedimientos y rolesProcedimientos y roles
Conductores de NegociosConductores de NegociosConductores de NegociosConductores de Negocios
Llaves indicadoras de PerformanceLlaves indicadoras de PerformanceLlaves indicadoras de PerformanceLlaves indicadoras de Performance
Eventos y DimensionesEventos y DimensionesEventos y DimensionesEventos y Dimensiones
Transformaciones y FuentesTransformaciones y FuentesTransformaciones y FuentesTransformaciones y Fuentes
Conductores de NegociosConductores de NegociosConductores de NegociosConductores de Negocios
Negocios de Negocios de ClientesClientes
Servicio a Servicio a nuevos Clientesnuevos Clientes
Desarrollo de Desarrollo de nuevos nuevos
productos o productos o serviciosservicios
Decreto de Decreto de GobiernoGobierno
Entrada de Entrada de nuevos nuevos
CompetidoresCompetidores
• Mejora las ventas a través de una mejor Identificación de los segmentos de mercado.
• Baja los costos identificando los servicios devaluados
• Mejora la satisfacción y la retención del cliente
• Provee métricas para mejorar la productividad del valor de la cadena
• Mantener una sección de definición de negocio
• Revisar el ambiente de tecnología informática
• Coleccionar y revisar las documentaciones de la Empresa
• Analizar y acceder a la información
•Desarrollar un plan de definición de pedidos y las fases del análisis de la arquitectura.
Ventas
Clientes
Competidores
Movimiento del Prod.
Guardado, Depart. Categorización ymezcla de prod.
Promociones
Fuente Laboral
Margen (Gross Profit)
LowLow Medium High Medium High
Primer manejo del Punto de Primer manejo del Punto de Chequeo (CheckPoint)Chequeo (CheckPoint)
• Incluye Sponsors de Negocios, Gerenciamiento de proyectos cliente y las llaves Skateholders
• Revisión y Aprobación de la fase entrega
• Identificando y discutiendo puntos abiertos
• Revisión y Aprobación del plan Proyecto para la próxima fase
Objetivos de NegociosObjetivos de NegociosObjetivos de NegociosObjetivos de Negocios
Necesidad de Análisis de Informaciones muy importantesNecesidad de Análisis de Informaciones muy importantesNecesidad de Análisis de Informaciones muy importantesNecesidad de Análisis de Informaciones muy importantes
Procedimientos y rolesProcedimientos y rolesProcedimientos y rolesProcedimientos y roles
Eventos y DimensionesEventos y DimensionesEventos y DimensionesEventos y Dimensiones
Eventos y DimensionesEventos y DimensionesEventos y DimensionesEventos y Dimensiones
Conductores de NegociosConductores de NegociosConductores de NegociosConductores de Negocios
Indicadores de mejoras en LlavesIndicadores de mejoras en LlavesIndicadores de mejoras en LlavesIndicadores de mejoras en Llaves
Fuentes y TransformacionesFuentes y TransformacionesFuentes y TransformacionesFuentes y Transformaciones
Identificación de Roles de los Participantes en el AnálisisIdentificación de Roles de los Participantes en el Análisis
Analista de Marketing Analista Financiero
Analista del ProductoAnalista de Ventas
* Venta del producto diario * Análisis del movimiento del producto * Respuesta de la estrategia de la oferta del producto
* Venta del producto diario * Análisis del movimiento del producto * Respuesta de la estrategia de la oferta del producto
Analizando los procedimientos identificando los rolesAnalizando los procedimientos identificando los roles
Análisis del Producto
Entendiendo los Roles de pedidos Entendiendo los Roles de pedidos de informaciónde información
Venta de los Productos DiariosAnálisis de los movimientos de los productosRespuesta en la estrategia de oferta del producto
“¿Cuántos errores tienen nuestros productos,por tamaño, por gusto, fueron vendidos cada mes este año, en la división Eastern, por depósito, medido por tamaño, comparadocon el mismo mes del año pasado?
VentaVenta
Numero de unidades vendidas
$ Ventas Revenue
Producto Bruto profit
Promoción Descuento
Objetos y eventos adicionales expuestos
Identificando los indicadores en la Identificando los indicadores en la mejora de la “Key”mejora de la “Key”
Identificación de la información de Identificación de la información de Objetos y EventosObjetos y Eventos
Venta de productos diarios
Análisis de Movimiento del Producto
Respuesta de la oferta del producto (Estrategia)
Tiempo
Producto
Organización
StockStock VentaVenta GrabadoGrabado
Identificación de FactoresIdentificación de Factores
• Elegir medidas y Factores
• Ordenar cantidad
• Valor del Dólar
• Contabilización del Inventario
Dimensiones y EventosDimensiones y Eventos
Conductores de NegociosConductores de NegociosConductores de NegociosConductores de Negocios
Objetivos del NegocioObjetivos del NegocioObjetivos del NegocioObjetivos del Negocio
Necesidad de Análisis de la información más Necesidad de Análisis de la información más importanteimportanteNecesidad de Análisis de la información más Necesidad de Análisis de la información más importanteimportante
Indicadores de llaves de mejoraIndicadores de llaves de mejoraIndicadores de llaves de mejoraIndicadores de llaves de mejora
Eventos y DimensionesEventos y DimensionesEventos y DimensionesEventos y Dimensiones
Procedimientos y RolesProcedimientos y RolesProcedimientos y RolesProcedimientos y Roles
Fuentes y TransformacionesFuentes y TransformacionesFuentes y TransformacionesFuentes y Transformaciones
Procedimiento de Marketing
Gerente de Marketing
Analista de Marketing
Analista de Venta
Desarrollo de Campaña
Analista deAnalista deCampañaCampaña
Datos de ClienteDatos de Cliente
Datos de VentaDatos de Venta
Información delInformación del ProductoProducto
Campaña Campaña InformativaInformativa
Buscando los eventos comunesBuscando los eventos comunes
Identificación de DimensionesIdentificación de Dimensiones
• Clientes
• Tiempo
• Producto
• Estatus
Segundo Checkpoint de Manejo Segundo Checkpoint de Manejo
• Finalize los requerimientos obteniendo procesos
• Solicitar un proyecto de decisiones de ir o no ir
FuentesFuentes y Transformacionesy TransformacionesConductores de NegociosConductores de NegociosConductores de NegociosConductores de Negocios
Objetivos del NegocioObjetivos del NegocioObjetivos del NegocioObjetivos del Negocio
Necesidad de Análisis de la información más Necesidad de Análisis de la información más importanteimportanteNecesidad de Análisis de la información más Necesidad de Análisis de la información más importanteimportante
Indicadores de llaves de mejoraIndicadores de llaves de mejoraIndicadores de llaves de mejoraIndicadores de llaves de mejora
Eventos y DimensionesEventos y DimensionesEventos y DimensionesEventos y Dimensiones
Procedimientos y RolesProcedimientos y RolesProcedimientos y RolesProcedimientos y Roles
Fuentes y TransformacionesFuentes y TransformacionesFuentes y TransformacionesFuentes y Transformaciones
Datos Datos WarehouseWarehouse
Vida cíclica de Datos WarehouseVida cíclica de Datos Warehouse
Data Marts
Transformaciones
ClienteCubo
Fuentes
Sistemas de Fuente OLTP
MetadataMetadata
TransformaciónTransformación de Documentaciónde Documentación
KPIsKPIsProcesos de Procesos de Captura del Captura del
SistemaSistema
Requerimientos de Requerimientos de Fuente de Fuente de
TransformacionesTransformaciones
EntregablesEntregables
• Datos de Fuente en diagramas de contexto• Documentación de la vida de los ciclos, incluyendo periódicamente, volúmenes esperados, fuentes de datos (especificaciones Metadata)
• Especificaciones de selección de datos y reportes
•Estrategias de Implementaciones y entregas de soluciones arquitectónicas.
RequerimientosRequerimientos TécnicosTécnicos IdentificadosIdentificados
• Infraestructura (Hardware y Software)
• Adquisición de datos de Población
• Respaldo y Recuperación
• Seguridad
TerminologíaTerminología de datos Warehousede datos Warehouse
• Dimensión
• Factores
• Medida
DiseñandoDiseñando Sistemas OLTPSistemas OLTP
• Diagramas de Relaciones de Entidades
• Normalización de la Tabla de Base de Datos
• Puntos de diseño de Sistemas OLTP
Normalización de la Tabla de BaseNormalización de la Tabla de Base de Datos de Datos
• Un grupo de implementaciones relacionales, secuenciales diseñado en base de datos con reglas
• Primer formulario normal
• Segundo formulario Normal
• Tercer formulario Normal
• Cuarto y Quinto Formulario Normal
Ventajas
• Previene anomalías de Actualización• Asegura la consistencia de los datos a través de las• transacciones.• Optimiza la eficiencia en los procesos de la aplicación• Reduce esfuerzo en modificación de aplicaciones
Desventajas
• Dificultad para diseñar reportes analíticos• Indíces que reduce la mejora
Hierarchies DimensionalesHierarchies Dimensionales
• El departamento “Grocery” puede tener muchas categorías
• La Categoría Bebidas puede tener muchas subcategorías
• La Subcategoría de Soda puede tener muchos productos
Entrega de Entrega de BebidasBebidas
Carnes, PapelCarnes, Papel
Soda, Cerveza y Soda, Cerveza y Botellas de Botellas de
AguaAgua
Cola, Naranja, Cola, Naranja, GrapaGrapa
Departamento Grocery
Categoría Bebidas
Subcategoría Soda
Consolidados Snowflaked Consolidados Snowflaked Overall Row Count Higher LowerOverall Row Count Higher Lower
Modelo Understandability Easier More Modelo Understandability Easier More DifficultDifficultNumber of Tables Less MoreNumber of Tables Less More
Query Complexity Simpler More ComplexQuery Complexity Simpler More Complex
Dimensional Searching Quicker SlowerDimensional Searching Quicker Slower
Bitmapped Indexing Supports InhibitsBitmapped Indexing Supports Inhibits
Hierarchies Snowflaked vs. ConsolidatedHierarchies Snowflaked vs. Consolidated
Pasos de Diseños de EsquemasPasos de Diseños de Esquemas Dimensionales Dimensionales
• Definiendo un Data Mart OLAP
• Eligiendo los factores
• Estableciendo Dimensiones
• Diseñando Modificaciones (Agregaciones)
Definiendo un Data Mart OLAPDefiniendo un Data Mart OLAP
• Estableciendo los procesos de requerimientos ganados
• Direccionar un simple proceso de negocios discreto
• Primer iteración debe ser basada de un sistema simple
• Estableciendo el requerimiento de la duración
Características DimensionalesCaracterísticas Dimensionales
• Atributos altamente correlacionados• Información Verbal Textual altamente calificada• Elementos y direcciones de nombres Parsed• Surrogate Key• Dimensiones Degeneradas• Dimensiones Junk• Dimensiones Conformados
Tabla de Características DimensionalesTabla de Características Dimensionales
• Contiene una llave primaria
• Tiene uno de tantas relaciones en los factores de la tabla
• Contiene al menos una columna de descripción
• Contiene otras columnas de atributos que son útiles para niveles de agregaciones.
• Contiene un set de celdas limitada que crecen lentamente a través del tiempo.
Características AgregadasCaracterísticas Agregadas
• El resumen de Esquemas son usados para unir las mejoras de petición
• Se puede acelerar los requerimientos por tres órdenes de Magnitud
Tamaño del Sistema estimado OLAPTamaño del Sistema estimado OLAP
* El factor de la Tabla será 97 a 99.9 porciento de OLAP El tamaño del sistema* Tamaño sobre todos Dimensionales (Grain Drives) Estima el numero de items en cada dimensión en la granualidad de los datos* Numero de celdas en si es la tabla del producto* Bytes estimados por celda 4 bytes por llaves de identificación estranjeras Medida del tamaño* Ejemplo de ventas guardadas.
Servicios de datos de Transformación Servicios de datos de Transformación
* Transformación de la naturaleza de los datos* El golpe Data (Data Pump)* Pasar a través de SQL* Paquetes DTS* Creación de paquetes DTS* Áreas de guardado DTS
Tipos de ServiciosTipos de Servicios* Servidores Remotos* Servidores con hipervínculos
Select emp.EmployeeID, ord. OrderID,ord.Discount
FROM SQLServer1.Northwind.dbo.Employees AS emp,OracleSvr.Catalog1.SchemaX.Orders AS ord
WHERE ord.EmployeeID = emp.EmployeeID AND ord.Discount > 0