conceptos de inteligencia de negocios

2
Bases de Datos Multidimensional Se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho. Data Warehouse Es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta. Datamart Es una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un Datamart puede ser alimentado desde los datos de una data Warehouse, o integrar por sí mismo un compendio de distintas fuentes de información. Sistemas OLTP Son bases de datos orientadas al procesamiento de transacciones. Una transacción genera un proceso atómico (que debe ser validado con un commit, o invalidado con un rollback), y que puede involucrar operaciones de inserción, modificación y borrado de datos. Sistemas OLAP Son bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc. Este sistema es típico de los Datamart. Operaciones Analíticas Básicas de los Sistemas OLAP Consolidación: este comprende el conjunto de datos. Esto puede involucrar acumulaciones simples o agrupaciones complejas que incluyen datos interrelacionados. Drill-Down: OLAP puede moverse en dirección contraria y presentar automáticamente datos detallados que abarcan datos consolidados. Slicing-Dicing: se refiere a la capacidad de visualizar a la base de datos desde diferentes puntos de vistas. Modelo de Datos de los Sistemas OLAP Existen tres tipos de modelos OLAP ellos son: MOLAP: en estos sistemas se encuentran almacenados los datos en una estructura de datos multidimensional (OLAP Multidimensional) ROLAP: son sistemas en los cuales los datos se encuentran almacenados en una base de datos relacional (OLAP Relacional) HOLAP: estos sistemas mantienen los registros detallados en la base de datos relacional, mientras que los datos resumidos o agregados se almacenan en una base de datos multidimensional separada. Sistemas de Gestión del Conocimiento Es un concepto aplicado en las organizaciones. Tiene el fin de transferir el conocimiento desde el lugar dónde se genera hasta el lugar en dónde se va a emplear, e implica el desarrollo de las competencias necesarias al interior de las organizaciones para compartirlo y utilizarlo entre sus miembros, así como para valorarlo y asimilarlo si se encuentra en el exterior de estas. Preparación de los Datos Selección de Datos Decidir qué datos serán usados para el análisis. Los criterios incluyen la importancia a los objetivos de la minería de datos, la calidad, y las restricciones técnicas como límites sobre el volumen de datos o los tipos de datos. Note que la selección de datos cubre la selección de atributos (columnas) así como la selección de registros (filas) en una tabla. Limpieza de Datos Elevar la calidad de los datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de los subconjuntos de datos limpios, la inserción de datos por defectos adecuados, o técnicas más ambiciosas tales como la estimación de datos faltantes mediante modelado. Construir Datos

Upload: frank-hernandez

Post on 18-Jan-2016

223 views

Category:

Documents


3 download

DESCRIPTION

Business Intelligence

TRANSCRIPT

Page 1: Conceptos de Inteligencia de Negocios

Bases de Datos MultidimensionalSe utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo (o columna), y otro campo por cada métrica o hecho.Data WarehouseEs una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perspectivas y con grandes velocidades de respuesta.DatamartEs una base de datos departamental, especializada en el almacenamiento de los datos de un área de negocio específica. Se caracteriza por disponer la estructura óptima de datos para analizar la información al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un Datamart puede ser alimentado desde los datos de una data Warehouse, o integrar por sí mismo un compendio de distintas fuentes de información.Sistemas OLTPSon bases de datos orientadas al procesamiento de transacciones. Una transacción genera un proceso atómico (que debe ser validado con un commit, o invalidado con un rollback), y que puede involucrar operaciones de inserción, modificación y borrado de datos.Sistemas OLAPSon bases de datos orientadas al procesamiento analítico. Este análisis suele implicar, generalmente, la lectura de grandes cantidades de datos para llegar a extraer algún tipo de información útil: tendencias de ventas, patrones de comportamiento de los consumidores, elaboración de informes complejos… etc. Este sistema es típico de los Datamart.Operaciones Analíticas Básicas de los Sistemas OLAP

Consolidación: este comprende el conjunto de datos. Esto puede involucrar acumulaciones simples o agrupaciones complejas que incluyen datos interrelacionados.

Drill-Down: OLAP puede moverse en dirección contraria y presentar automáticamente datos detallados que abarcan datos consolidados.

Slicing-Dicing: se refiere a la capacidad de visualizar a la base de datos desde diferentes puntos de vistas.Modelo de Datos de los Sistemas OLAPExisten tres tipos de modelos OLAP ellos son:

MOLAP: en estos sistemas se encuentran almacenados los datos en una estructura de datos multidimensional (OLAP Multidimensional)

ROLAP: son sistemas en los cuales los datos se encuentran almacenados en una base de datos relacional (OLAP Relacional) HOLAP: estos sistemas mantienen los registros detallados en la base de datos relacional, mientras que los datos resumidos o

agregados se almacenan en una base de datos multidimensional separada.Sistemas de Gestión del ConocimientoEs un concepto aplicado en las organizaciones. Tiene el fin de transferir el conocimiento desde el lugar dónde se genera hasta el lugar en dónde se va a emplear, e implica el desarrollo de las competencias necesarias al interior de las organizaciones para compartirlo y utilizarlo entre sus miembros, así como para valorarlo y asimilarlo si se encuentra en el exterior de estas.Preparación de los Datos

Selección de DatosDecidir qué datos serán usados para el análisis. Los criterios incluyen la importancia a los objetivos de la minería de datos, la calidad, y las restricciones técnicas como límites sobre el volumen de datos o los tipos de datos. Note que la selección de datos cubre la selección de atributos (columnas) así como la selección de registros (filas) en una tabla.

Limpieza de DatosElevar la calidad de los datos al nivel requerido por las técnicas de análisis seleccionadas. Esto puede implicar la selección de los subconjuntos de datos limpios, la inserción de datos por defectos adecuados, o técnicas más ambiciosas tales como la estimación de datos faltantes mediante modelado.

Construir DatosEsta tarea incluye la construcción de operaciones de preparación de datos tales como la producción de atributos derivados o el ingreso de nuevos registros, o la transformación de valores para atributos existentes.

Integrar DatosEstos son los métodos por el cual la información es combinada de múltiples tablas o registros para crear nuevos registros o valores.

Formatear DatosFormateando transformaciones se refiere a modificaciones principalmente sintácticas hechas a los datos que no cambian su significado, pero podría ser requerido por la herramienta de modelado.Minería de los DatosEs el conjunto de técnicas y tecnologías que permiten explorar grandes bases de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.