infosphere datastage

11
INFOSPHERE DATASTAGE Róbinson Andrés Mejía Nexos Software SAS

Upload: andres-mejia

Post on 28-Oct-2015

69 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: INFOSPHERE DATASTAGE

INFOSPHERE DATASTAGE

Róbinson Andrés MejíaNexos Software SAS

Page 2: INFOSPHERE DATASTAGE

Capitulo 1: Fundamentos

Page 3: INFOSPHERE DATASTAGE

ObjetivosO Definir BIO Definir ETLO Definir Data warehouseO Algunas herramientas de ETLO Fundamentos de DatastageO Componentes de Datastage

Page 4: INFOSPHERE DATASTAGE

Business intelligence

Inteligencia empresarial (Business Intelligence), también llamado “Gestión de los Datos” (Data

Management), es un agregado de aplicaciones y herramientas

enfocadas al procesamiento de los datos en una empresa para poder ayudar tomar decisiones y hacer

varios análisis.

Page 5: INFOSPHERE DATASTAGE

Business intelligenceAlgunos conceptos importantes concernientes a la inteligencia de negocios:

O DW - Almacenes de datos, Bodegas de Datos (Data warehouses)

O ETL - Transformar, Extraer y Cargar datosO DM - Minería de datos (Data mining)O Aplicaciones OLAP - cubos OLAP, procesamiento

analítico línea, Online Analytical Processing and multidimensional analysis

O MIS - Sistemas de Información para la Administración (Management Information Systems)

O Consultas e informes - Information visualization, and Dashboarding

O Calidad de Datos y limpieza de DatosO Sistemas de previsión empresarialO DSS - Apoyo en la toma de decisiones (Decision

Support Systems)O CRM - Customer Relationship Management

Page 6: INFOSPHERE DATASTAGE

ETL (Extracción, Transformación y Carga)

El proceso ETL organiza el flujo de los datos entre diferentes sistemas en una organización y esta fase de importar y cargar datos se suele realizar con una herramienta ETL (como por ejemplo Informática Powercenter, Datastage). También es posible y ocurre a menudo programar el proceso ETL en el lenguaje dedicado a la base de datos (PL/SQL por ejemplo).

Page 7: INFOSPHERE DATASTAGE

Almacén de Datos

Un Almacén de Datos (Data Warehouse) es una colección de datos que está formada por Variables (hechos, facts) y Dimensiones (dimensions). Dimensiones son los elementos para ubicar datos que participan en el análisis y Variables los valores que se desean analizar.

Page 8: INFOSPHERE DATASTAGE

Fundamentos Datastage

DataStage es una herramienta ETL que permite crear y mantener fácil y rápidamente almacenes de datos procedentes de sistemas de Aplicaciones Empresariales incluyendo SAP, Siebel, Oracle y PeopleSoft CRM y de otros sistemas relacionados al negocio.

Page 9: INFOSPHERE DATASTAGE

Fundamentos Datastage

Datastage soporta la extracción, integración y transformación de altos volúmenes de datos desde estructuras simples hasta muy complejas. Entre funciones de DataStage, la más destacada es el diseño de tareas que extraen, integran, agregan, cargan y transforman los datos para el Data Warehouse o Data Mart. Las tareas son compiladas para crear ejecutables que son calendarizados por el Director y ejecutadas por el Servidor.

Page 10: INFOSPHERE DATASTAGE

Componentes Datastage

Hay cuatro componentes principales de la herramienta Datastage:

O Administrator - Interfaz de usuario usada para configurar proyectos de Datastage y usuarios. Gestiona administración de proyectos de DataStage en ambientes de desarrollo y producción.

Page 11: INFOSPHERE DATASTAGE

Componentes Datastage

O Designer - usada para crear, diseñar y compilar tareas Datastage (también permite testear y ejecutar). Mayormente usado por los desarrolladores.

O Director - para validar, calendarizar, testear, ejecutar y monitorizar jobs Datastage. Usado por los operadores y los testers.

O Manager - interfaz de usuario usada para visualizar y editar el contenido del repositorio.