resumen inteligencia de negocios

14
Objetivos solución BI Disponer de una infraestructura que permita a los decisores obtener la información que necesitan. Decisores pueden estar en niveles superiores u operativos. También podría darse a externos como valor agregado. En cuanto a la info, importa su contenido, que sea correcta, la oportunidad (en el momento requerido para tomar la decisión) y el formato y los estilos de exploración, según el grado de detalle que se busque. Que la organización haga uso eficaz de la infraestructura. Requisito que el fin sea tomar una decisión para que sea útil. La empresa no tiene una base de datos que integre los datos de la compañía. DW: Un tipo de base de datos más herramientas (aplicaciones, tableros, análisis multidimensional, reportes) que trabajan contra el DW. Áreas de trabajo: Construcción de la solución Analisis del negocio: Relevamiento, entender el alcance, planificación y el diseño de la info que se requiere. Desarrollo del DW: Formalizar fuentes de datos, procesos de extracción, transformación y carga. Desarrollo del entorno de exploración: construir metadatos y herramientas de usuarios Implementación de la solución: implementación de hw y sw y la dinámica con los usuarios. Beneficios esperados Para la organización Aumentar el potencial de los datos almacenados Aumentar la calidad de la toma de decisiones Unificar conceptos de negocios en toda la institución Visualizar la realidad organizacional en forma integrada Para los usuarios Disminuir el tiempo dedicado a elaborar la info, permitiendo d edicar mayor tiempo al análisis. Disponer de una fuente única y confiable.

Upload: insertcoinapps

Post on 03-Oct-2015

15 views

Category:

Documents


1 download

DESCRIPTION

Business intelligence

TRANSCRIPT

Objetivos solucin BIDisponer de una infraestructura que permita a los decisores obtener la informacin que necesitan. Decisores pueden estar en niveles superiores u operativos. Tambin podra darse a externos como valor agregado.

En cuanto a la info, importa su contenido, que sea correcta, la oportunidad (en el momento requerido para tomar la decisin) y el formato y los estilos de exploracin, segn el grado de detalle que se busque.

Que la organizacin haga uso eficaz de la infraestructura.Requisito que el fin sea tomar una decisin para que sea til.

La empresa no tiene una base de datos que integre los datos de la compaa. DW: Un tipo de base de datos ms herramientas (aplicaciones, tableros, anlisis multidimensional, reportes) que trabajan contra el DW.reas de trabajo: Construccin de la solucin Analisis del negocio: Relevamiento, entender el alcance, planificacin y el diseo de la info que se requiere.

Desarrollo del DW: Formalizar fuentes de datos, procesos de extraccin, transformacin y carga.

Desarrollo del entorno de exploracin: construir metadatos y herramientas de usuarios Implementacin de la solucin: implementacin de hw y sw y la dinmica con los usuarios.

Beneficios esperadosPara la organizacin Aumentar el potencial de los datos almacenados

Aumentar la calidad de la toma de decisiones

Unificar conceptos de negocios en toda la institucin

Visualizar la realidad organizacional en forma integrada

Para los usuarios Disminuir el tiempo dedicado a elaborar la info, permitiendo dedicar mayor tiempo al anlisis.

Disponer de una fuente nica y confiable.

Aumentar la autonoma y facilidad para acceder a la informacinPara el rea de Tecnologa de la informacin Mayor capacidad para dar respuesta a las necesidades de informacin

Menor intervencin en el da a da. DecisionesProceso mental deliberado, voluntario, sistemtico, racional. Puede haber racionalidad limitada. Soluciones realistas. Se establecen, analizan y evalan alternativas con el fin de seleccionar solo una.

Decisor (sist. Sujeto) afectado por condicionamientos, informacin y conocimiento decide para modificar el universo (sist. Objeto). Trae consecuencias.

Dato info conocimiento decisin accin

El dato se procesa, el sujeto le da valor en un determinado contexto. El conocimiento es el paso siguiente a la informacin, entiendo qu pasa y cmo accionar contra eso, entiendo que accin debo tomar.

Proceso decisorioInteligencia diseo eleccin revisinDetectar problema, desarrollar alternativas, seleccin de un curso de accin, implementar curso de accin y evaluar la eleccin y sus consecuencias.

Clases de decisiones segn:Programacin Programada: Otorgar descuento a partir de cierto monto Habito, procedimientos operativos estndar, estructura organizativa. Aporte de TI: automatizacin de procedimientos administrativos a travs de sistemas de procesamiento de transacciones.

No programada: Cambiar de rubro comercial Criterio, intuicin y creatividad. Reglas empricas, seleccin y entrenamiento de ejecutivos. Aporte TI: Brindar infraestructura tecnolgica para proveer de la informacin para la toma de decisiones. IA y Tecnicas heursticas para la solucin de problemas.Reversibilidad Reversible: Tercerizar el servicio de limpieza

Irreversible o poco reversible: Trasladarse a otro pas

Plazo de efectos futuros: Corto o largo plazo

Impacto o alcance Bajo o alto

Jerarqua Inferior

Superior

Centralizacin y descentralizacinCentralizacin: La autoridad para la toma de decisiones se concentra en los niveles superiores.Descentralizacin: La autoridad para la toma de decisiones se traslada a niveles inferiores.

Decisiones mientras mas arriba en la pirmide:Poco programables, difciles de revertir, efectos a mediano y largo plazo, impacto mltiple, jerarqua superior.

Info: Ad hoc, resumida, ocasional, externa e interna, integral.

Decisiones abajo en la pirmide: Programables, fciles de revertir, efectos a corto plazo, impacto nico, jerarqua inferior.

Info: especificada con anterioridad, detallada, frecuente, interna, especfica.

Monitoreo - Managers: Info grafica, BI: Tableros Anlisis lnea media: Info agregada. BI anlisis multidimensional, datamining,

Detalle trabajadores operativos: Info detallada. BI: ReportingOLTP OLAP (Online Transactional / Analytical processing)OLAP: Herramienta de anlisis multidimensionalOLTP: Sistemas transaccionales operacionales.

Caractersticas transacciones: Actualizan y/o consultan un conjunto de pocos registros.

Alto nivel de concurrencia de las transacciones que consultas y actualizan. Actualizacin y consultas on-line, que deben tener una respuesta instantnea para no trabar las operaciones de la organizacin.

Reciben muchas transacciones de pocos registros, alto desempeo en el acceso a los registros y su actualizacin. Alta disponibilidad

Normalizadas, para favorecer la actualizacin en lnea y disminuir la probabilidad de inconsistencias que podran generarse.

Indices que favorezcan la actualizacin en lnea (ndices b+)

Incluyen mtodos de recuperacin y protocolos de control de ocncurrencia que aseguren la consistencia de la base de datos ante fallos y actualizaciones concurrentes

Los tres problemas del OLTPInformacin no integrada, inadecuados tiempos de respuesta, consultas ad-hoc no amigables y la inexistencia de herramientas.Los datos que representan la realidad de la organizacin se encuentran muchas veces dispersos. Tienen diseos conceptuales y fsicos independientes entre s. Diferentes visiones de una misma realidad entre los decisores de la org. Imposibilidad de obtener informacin integrada que permita comparar, clasificar y consolidar la informacin de las distintas reas, sectores, procesos para analizar a la organizacin como un todo.

Se puede entorpecer el nivel de respuesta de los sist de nivel operativo, debido al uso intensivo de los recursos que genera el procesamiento de las consultas para la toma de decisiones.Poder acceder a la informacin sin necesitar conocimientos profundos sobre el uso de la tecnologa. Si existen los problemas 1 y 2 (descentralizacin de la bd e inadecuados tiempos de respuesta) el DW es la solucin. Si existe el problema 3, se debe explorar las tecnologas de BI.

Reporte: Formato especfico para impresin. Principalmente nmeros.Analisis multidimensional: Visin flexible y menos estructurada con selectores que combinen distintas vistas del mismo cubo, con la posibilidad de navegar, cambiar filtros, dril down/up.

Dashboard: combinando grilla, grficos e indicadores grficos con filtros pre definidos.

Como trabajar el rea de anlisis del negocio

Necesidades vs datos existesntes. Anlisis de las necesidades de info, alcance, formalizar datos existentes, necesidades de info, diseo del data warehouse.

Generar una relacin con los usuarios (niveles superiores) desde el inicio, pensando en la implementacin. Debe dedicarse mucho tiempo a esta relacin y resistirse a avanzar sin ellos.Desarrollo del entorno de exploracinDefinicin de metadatos Construir las dimensiones: jerarquas y atributos

Construir mtricas e indicadores Realizar pruebas internas de navegacin y calidad de datos.

Diseo de los front-end Esquema y look and feel

Construir los reportes y dems salidas bsicas de acceso

Realizar pruebas internas

Implementacin de la solucinUsuarios Capacitacin y exploracin conjunta, ajustes finales y soporte.

Tecnologa Diseas la infraestructura tecnolgica

Relevar y documentar requerimientos de la arquitectura

Diseo modelo de arquitectura de alto nivel.

Seleccin de productos

Determinar fases para implementar arquitectura

Implantar la infraestructura

Configurar el hardware

Instalacin y configuracin del software

Puesta a punto de la arquitectura y solucin Pasaje a produccin

El DW Integra datos de los distintos sistemas OLTP Incorpora datos externos para analizar variables del entorno

Incorpora datos histricos que no existan en los sistemas OLTP (por ventana operacional y/o update de datos)

El diseo y administracin de la base de datos pensado para un procesamiento OLAP eficiente:

Guardar datos pre calculados

Indices que optimicen este tipo de consultas

Estructuras de datos redundantes Independizar la base de datos de la alta concurrencia del OLTP Posibilita diseos que faciliten su exploracin por parte de los usuarios

Criterios de diseo Construccin iterativa e incremental

Basada en un modelo de datos unificado que sea el roadmap de todo el desarrollo Redundancia Para mejorar la performance Diseo relacional y multidimensional El segundo suele estar apuntado a necesidades de info. Pueden convivir

Granularidad

Alta o baja

RedundanciaPropiedadEfectos

Base OLTPDW

Acelerar consultas con datos precalculadosOO

Mayor tiempo en actualizacin de datosXX

Mayor probabilidad de generar inconsistenciasXX

Mejorar controlesOO

Espacio de almacenamientoXX

Caracteristicas:

Inmon: Orientado a temas, integrados, no voltiles, histricos.

EL ODS: Operational data storeBase de datos complementaria: pretende lograr alta performance de acceso, cuando el DW no puede darlo.Integrada, ambiente separado al operacional, para realizar procesamiento analtico (OLAP).

Datos corrientes, no histricos. Datos pre calculados de la historia del DW.

Puede ser real time con pequeas actualizaciones de poco tiempo.Inmon vs KimballDW vs Data Mart. Foco en la integracin de los datos vs explorar informacin desde las necesidades del negocio.Area de trabajo -> dw objetivo -> dw subjetivo -> data marts

Area de trabajoRestringida solo al equipo de desarrollo de ETL.

Tomar los datos de los OLTP tal cual estn: minimiza el tiempo de acceso, si falla el proceso no es necesario volver a ingresar a los OLTP.DW ObjetivoCopia de datos de los sistemas OLTP, generar una base de datos OLTP integradas, no es el ODS de Inmon. Mismo nivel de desagregacin. Puede omitir algunos atributos. Los cambios al ETL se realizan por cambios en los sistemas OLTP, no por las necesidades de informacin.

Objetivo buscado del dw objetivo Generar reportes operativos Permitira actualizacin en tiempo real No estar focalizado en las necesidades de areas de usuarios en particular.

No es necesario realizar ETL de integracin ante nuevas necesidades de informacin

DW SubjetivoSe organizan los datos en funcin a la exploracin de la informacin. Modelo dimensional: tablas de hechos y dimensiones.Objetivo buscado del dw subjetivo Armar tantas tablas de hechos como necesiten los anlisis de informacin dimensionales Realizar distintas construcciones en base a los mismos datosIntegracin de datos: ETLEs pasaje de datos simplemente? No. Ajusta las multiples fuentes de datos, proporciona medidas sobre la calidad y confianza en los datos. Elimina errores, corrige faltantes de ser posible, estructura los datos para ser usados por herramientas de usuario final, documenta los flujos de datos que alimentan el DW.ETL: ProblemticaLas aplicaciones transaccionales fueron pensadas en sus propios requerimientosEsquemas heterogneos, codificacin divergente, Datos redundantes, distintas tecnologas, calidades de datos heterogneas.Distintas unidades de medida, mismo nombre y diferente contenido, criterios sintcticos o semnticos diversos. Mismo dato con distintas identificaciones en los repositorios, las claves al ser distintas no pueden referenciarse. Identificar cual es el atributo valido.

Tomar los datos de los sist operacionales sin afectar su operatoria. Como extraer los cambios que han sido realizados en los sistemas operacionales desde el ltimo refresh del DW.

Importa el volumen de datos, la secuencia y la periodicidad de procesamiento y actualizacin.ETLE: Identificar las fuentes de datos multiples Entender diversos modelos de datos heterogneos Conectarse y accedr sin interferir Capturar los datos cambiados durante extracciones Disponibilizar los datos extraidos en discoT: Limpieza de datos

Validar la estructura Validar dominio Elegir la fuente mas confiable

Corregir u omitir valores incorrectos

Generar meta data que describa la calidad de datos

Disponibilizar datos limpios en disco y manejo de errores. Integracin y homogeneizado

Mapear las columnas del dw con las columnas de las fuentes, algoritmos Consolidar duplicaciones Unificar claves con equivalencias Homogeneizar niveles de agregacin Moldear datos para su navegacin

Adecuaciones para poder integrar denominaciones de negocios (dimensiones), mtricas e indicadores de performance

L: cargar los datos que sern consumidos por los usuarios. Cargar dimensiones y tablas de hecho Generar dimensiones de tiempo

Cargar y modificar agregaciones

Disponibilizar los datos para ser consumidos

Mapeo lgicoDocumentar la lgica del ETL. Logical data map document. Tiene formato de tabla. Se llenan filas por cada columna que hay que cargar en el destino.

Destino -> origen -> transformacin a realizar.

Analisis multidimensionalHechos -> medidas. Cunto.La dimensin sera el contexto, qu, dnde, cundo.

Las dimensiones tienen jerarquas, de gruesa a fina, las cuales tienen mtricas e indicadores. El indicador es ms elaborado que la mtrica, presenta un estado de situacin.

Concepto de cubo

Tres dimensiones o ms.

Medidas Aditivas: pueden agregarse por cualquiera de las dimensiones. Ej: cantidad comprada

Semi aditivas: pueden agregarse por algunas de las dimensiones, no todas. Ej: stock puede ser aditiva para producto pero no para tiempo

No aditivas: no se pueden agregar por ninguna dimensin. Ej: temperatura.

Las semi y no aditivas pueden ser resumas en mtricas utilizando otas operaciones como MaX, MIN, promedio.MtricasDirectas: funciones sobre una medida o atributo. Ej suma, promedio, contar, max, min.

Mtricas calculadas: funciones sobre clculos entre medidas y atributosAnalisis multidimensional: armado de la info en forma dinmica. Consultas ad-hocEntorno grfico y amigable, el usuario necesita conocer principalmente el lenguaje del negocio. La realidad del negocio se modela en trminos de medidas y dimensiones.

Medidas/Metricas: ventas Q, ventas$, precio promedio, costos

Dimensiones: Tiempo, producto, geografa

Jerarquias: dentro de tiempo: ao, trimestre, mes.

Modelado dimensional conceptualObjetivo: representar las necesidades de informacin sobre una temtica del negocio que debe resolver la solucinSobre l basa: modelo dimensional lgico y herramientas de exploracin.

Desde la perspectiva del negocio se definen mtricas y dimensiones con jerarquas relevantes.

Dimensiones recursivas: No es posible establecer niveles jerrquicos. La jerarqua se construye dinmicamente a partir de las relaciones padre-hijo que existen entre los miembros. Como empleado o rea.Pasos

Trabajar de un area tematica a la vez

Identificar decisores claves para dicha temtica Definir junto a dichos decisores las mtricas sobre las que al negocio le interesa saber para decidir. Identificar las dimensiones sobre las que al negocio le interesa analizar las mtricas. Identificar las jerarquas ms relevantes por dimensin e identificar la granularidad de exploracin.

Graficarlo en el diagrama y reconfirmar y ampliar

Evaluar las mtricas y su relacin con las dimensiones: agregar propiedades en el modelo.