Download - SAP Data Intelligence
SAP Data Intelligence
NOSOTROS
Multinacional de servicios TIC de capital 100%
español fundada en 1982
Oficinas en Europa,
Latinoamérica, EEUU, Africa y
Oriente Medio
Presencia en 62 sedes
y 32 países
FACTURACIÓN
total de
464M€+4.700
PRODESIONALES
+500clientes BI
+150EXPERTOS
soluciones BI
+280proyectos en el
2019
en +30 sectores
¿En dónde estamos?
Nuestras Soluciones
• Business
Intelligence• Advanced/
predictive analytics • Big data
• Performance
management
• Risk
management• Enterprise data
management
• Data
Governance
Retos✓ Actúa en tiempo real
en un entorno cambiante.
✓ Anticípate a tendencias y
riesgos.
✓ Garantiza la seguridad en la
gestión de la información.
✓ Aumenta la inteligencia en
la toma de decisiones de
negocio.
Te asesoramos en todo el ciclo de InformaciónCon una metodología contrastada
Identificar
Diseñar
Desplegar
Implementar
Operar
1. Identificar iniciativas
claves en tu organización
2. Diseñar y generar plan de
trabajo para
3. Definimos el plan
de implementación
4. Desplegamos
La metodología y la
tecnología
5. Continuidad
operativa
Centro de Soporte
Servicios Gestionados
Proyectos Cerrado, Servicio Gestionado
con, metodología Agile y Design
Thinking.
Soluciones End to End
Paquetes de rápida implantación
¿Qué es Big Data?
Big Data es un término que describe el
gran volumen de datos, tanto
estructurados como no estructurados, que
inundan una empresa en el día a día.
Pero no es la cantidad de datos lo que
importa. Lo que las organizaciones hacen
con los datos es lo que realmente importa.
La Big Data se puede analizar para
obtener información que conduzca a
mejores decisiones y movimientos
estratégicos de negocios.
¿Las 5 “V” de Big Data?
• Velocidad: Velocidad con la que los datos se acumulan.
• Volumen: Escala de los datos o el aumento de la cantidad de datos almacenados.
• Variedad: Es la diversidad de los datos. Tenemos datos estructurados que encajan perfectamente
en filas y columnas, o bases de datos relacionales y datos no estructurados que no están
organizados de una manera predefinida, por ejemplo, Tweets, blogs, imágenes, números e incluso
datos de vídeo.
• Veracidad: Es la conformidad con los hechos y la exactitud. Con la gran cantidad de datos
disponibles, el debate se centra en la precisión de los datos en la era digital.
• Valor: Refiere a nuestra capacidad y necesidad para convertir los datos en valor. El valor no es sólo
el beneficio redituable, sino también. pueden ser beneficios médicos o sociales, o la satisfacción del
cliente, empleado o personal.
¿Qué es Hadoop?
Apache Hadoop es una plataforma desoftware de código abierto para elalmacenamiento distribuido yprocesamiento distribuido de grandesconjuntos de datos en clústeresinformáticos construidos del hardware deproductos básicos.
Los servicios de Hadoop prevénalmacenamiento de datos,procesamiento de datos, acceso a losdatos, gestión de datos, seguridad yoperaciones.
Hadoop – Distribución y ecosistemas
El empaquetado de tecnologías del
ecosistema Hadoop cuenta con una
capa de gestión añadida y soporte
empresarial.
Las principales son:
• Cloudera
• Hortonworks
• MapR
Un repositorio de almacenamiento en la nube, generalmente basado en tecnología Hadoop, que contiene una gran cantidad de datos en bruto en su formato nativo hasta que los mismos se necesiten. Sus ventajas son las siguientes:
Almacena económicamente datos ilimitados.
Recopilación de todos los datos "por si acaso”.
Almacenamiento de datos sin modelar - ”Schema on read”.
Complementa el Enterprise Data Warehouse.
Libera recursos de Enterprise Data Warehouse caros.
Rápido acceso de los usuarios a los datos.
Herramientas ETL/ELT de Hadoop.
Fácilmente escalable.
Con Hadoop, alta disponibilidad incorporada.
Data Lake es el centro de una solución de Big Data
Data Warehouse y Data Lake: cuando utilizar cada uno
Data Warehouse Característica Data Lake
Relacional, para Sistemas transaccionales, base de datos
operacionales, contiene información oficial para la toma
de decisión
Data
Datos relacionales y no relacionales, Audio,
v ideo, RRSS, IoT, logs, mobile. Repositorio para
desarrollo ágil de apps, análisis de información y
PoC
Su estructura se diseña y luego se crea Schema Diseñado en tiempo de ejecucion (análisis)
Tiempos de respuesta altisimo, mayor costo de
alamacenamientoPrice/Performance
Tiempos de respuestas altos menor costo de
almacenamiento
Datos altamente procesados sirve como la unica versiond
de la verdad.
Data QualityDatos brutos, semi-procesados y procesados
Analistas de negocios UsersData Scientists, Data Developers, y Analistas de
Negocio (poco frecuente)
Reportes en batch, BI y v isualizacion AnalyticsMachine Learning, Predictive Analytics, Data
Discovery y perfilamiento.
Machine Learning
Machine Learning es una disciplina científica del ámbito de la Inteligencia Artificial que crea sistemas que aprenden automáticamente.
Aprender en este contexto quiere decir identificar patrones complejos en millones de datos.
La máquina que realmente aprende es un algoritmo que revisa los datos y es capaz de predecir comportamientos futuros.
Automáticamente, también en este contexto, implica que estos sistemas se mejoran de forma autónoma con el tiempo, sin intervención humana.
Aplicación del Machine Learning
A continuación se muestran algunos de los principales problemas reales en los que distintas compañías
están aplicando Machine Learning en la actualidad:
• Utilización de imágenes en lugar de palabras clave para buscar productos de una empresa, o
artículos similares.
• Identificar marcas y logotipos de empresas en fotos publicadas en redes sociales.
• Orientación de anuncios y predicción de las preferencias de los clientes.
• Identificación y seguimiento de los niveles de confianza de los clientes, sus opiniones y actitud
en diferentes canales online y servicios de soporte automatizado al cliente.
• Identificación de clientes potenciales.
• Detección de fraudes, recomendaciones a clientes, gestión de relaciones con los clientes, etc.
• Identificación en textos de sentimientos positivos y negativos, temas y palabras clave.
• Localización de caras e identificación de emociones faciales.
• Reconocimiento de voz.
• Clasificación de vídeos.
Métodos del Machine Learning
Jupyter Notebook
El Jupyter Notebook es un entorno interactivo web de ejecución de
código en los que, por ejemplo, puedes incluir gráficas que ayuden
en el análisis e explicación de tus datos. Utilizados para facilitar la
explicación y reproducción de estudios y análisis.
Para trabajar con ellos se realiza
directamente desde el navegador. Estos notebook se pueden
almacenar e intercambiar o mostrar en páginas web.
Big Data y
Datos Diversos
Inteligencia
Aplicada
Procesos de
negocios
reinventados
Datos de SAP HR
Datos de antigüedad
de SFSF
Modelo R Best Fit
Datos de
localización
UOG vs.
Score de
empleados
Scoring de
conocimiento
Áreas y datos de
conocimiento
Mejora de HR con SAP Data Intelligence
El objetivo de negocio: encontrar los mejores dentro de la fuerza laboral que se ajustan para cubrir los puestos vacantes
Mejora de HR con SAP Data Intelligence
El estado antes de Data Intelligence: integración manual y lotes semanales
Datos personales
del empleado y
datos del puesto
de trabajo
Datos de
antigüedad
del empleado
Áreas y datos
de
conocimiento
Scoring de
conocimiento
del empleado
Best Fit
Hoja de Excel con
los empleados BestFitting, actualizada
semanalmente
Actualizaciones
semanales
Extracción de
datos punto a
punto
Integraciones
manuales
punto a punto
Extracciones de
datos a archivos
de Excel
Mejora de HR con SAP Data Intelligence
SAP Data Intelligence
Datos personales
del empleado y datos del puesto
de trabajo
Datos de
antigüedad del empleado
Áreas y datos
de conocimiento
Scoring de
conocimiento del empleado
Best Fit
Datos de
distancias de Empleado -
Ubicación UOG
Escala de
scoring según ubicación
Lista de empleados
de mejor ajuste relacionada con el
código UOG de entrada
Matching en
tiempo real por
código UOG
Data Intelligence
pipelines
La solución con Data Intelligence: operacionalización optimizada, información en tiempo real
Vista de 360 grados de un consumidor
Big Data y Datos
Diversos
Inteligencia
Aplicada
Procesos de negocios
reinventados
Predecir el
comportamiento del
gasto del consumidor
Datos de la
tienda en línea
Datos de
seguimiento del
runner
Algoritmos de
clusteringbasados en ML
Predictive
Analytics
El objetivo de negocio: comprender y predecir el comportamiento del consumidor y el perfil del gasto
Vista de 360 grados de un consumidor
Centro Datos Empresarial
Consumidor
Consumidor
Venta
Online
Data Warehouse Cloud
Seguimiento
del Runner
Datos de ventas
del cliente
Snowflake
Datos en
ejecución
Descubrimiento de
hábitos de running
Sin minería de
conjuntos de datos
combinados, sin
análisis avanzado
Información de
ventas del cliente
Vista de 360 grados de un consumidor
Data Intelligence
pipelines
Consumidor
Consumidor
Venta
Online
Seguimiento
del Runner
Data Warehouse Cloud
Centro Datos Empresarial
Snowflake
Datos en
ejecución
Análisis y
predicción del
comportamiento
del consumidor
Vista 360
Ejecución y
entrenamiento
de MLDatos de ventas
del cliente
Gestión simplificada
del ciclo de vida de
ML
El proyecto con Data Intell igence: Data Science simplificado en toda la arquitectura.
Centro de simulación de energías renovables
Big Data y Datos
Diversos
Inteligencia
Aplicada
Procesos de negocios
reinventados
Desarrollo de
infraestructura inteligente
Producción de
energía (eMeter /
Kafka)
Datos de carga de red(Scada / OsiSoft)
Algoritmos de
clusteringbasados en ML
Predictive Analytics
Activos y
capacidad (ERP y non-
SAP CRM)
Consumo de
energía del cliente (SAP IS-U and CRM)
El objetivo de negocio: ayudar a los municipios a mejorar su producción renovable
Centro de simulación de energías renovables
Data Intelligence
pipelines
Centro de
simulación de
energías
renovables
Desarrollo de
infraestructura
inteligente
Calcular la
producción de
energía
Datos de carga
de red
Consumo de
energía
Calcular
capacidad por
municipio
Producción
de Energía
Datos de
activos
Consumo de
energía
Predicciones
de carga de
cuadrícula
Datos de
activos
CRM
La implementación: ¡los municipios obtienen una visión de extremo a extremo sobre el posible desarrollo!
La evolución de la gestión de datos en entornos empresariales
Diversidad
de Datos
Inteligencia Empresarial
Integración de AplicacionesMFT, EAI, ESB, SOA, B2B,
BPM/BRM…
Integración de AnalyticsETL, EDW, BI, MIS, Data
Marts…
Orquestación de Datos(HTAP, Big Data, Cloud etc.)
Streaming, IoT, ML, Big Data,
Advanced Analytics…
Advanced Analytics y ML desafían la Gestión de Datos a un grado completamente nuevo!
• Streaming estructurado y no
estructurado.
• Batch, (near) real-time
• Transaccional, Analítico,
Híbrido
Integración
• Varios motores heterogéneos
• Diversos patrones de
procesamiento (fuera de línea,
lambda, controlado por
eventos ...)
Procesamiento
• Descubrir los conjuntos de
datos disponibles y descubra
su semántica
Descubrimiento
• Inconsistencias de datos y
fragmentación
• Conjuntos de datos sesgados
• Ciclo de v ida del modelo ML
Calidad
• Privacidad y protección de
datos.
• Linaje de datos y auditoría
Conformidad
• Arquitecturas distribuidas, en la
nube y on-premise
• Escalamiento elástico
• Monitoreo
Operaciones
Gestión Inteligente de Información
• Las herramientas de colaboración entregan
datos confiables
• Pipelines de datos modulares
• Arquitectura en diferentes fuentes de datos
• Gobernar y gestionar metadatos
1 Data Ops 2 Data Catalog 3 Data Fabric 4 Data Orchestration
C O L A B O R A C I O N O R Q U E S T A C I Ó N
Gestión Inteligente de Información Data Ops • Data Catalog • Data Fabric. • Data Orchestration
Descripción General: SAP Data Intelligence
conectar | extraer valor |
escalar
Inteligencia Artificial Empresarial
Desarrollo de Machine Learning | Despliegue de modelo | Gestión del ciclo de vida
Cualquier tipo de
fuente de datos(estructurado, no
estructurado, streaming)
SAP y datos de
aplicaciones de terceros
Descubrir, acceder,
y preparar
Transformar y
proceso
Implementar, escalar
y gestionar
Gestión Inteligente de Información
Data Ops • Data Catalog • Data Fabric. • Data Orchestration
Descripción General: SAP Data Intelligence
Línea de montaje para innovación basada en datos
Datos de Streaming Datos Estructurados Datos No Estructurados
Conectar
Conectar Aprender Escalar Consumir
Machine Learning
Deep Learning
Data Hub de Orquestación
Preparación de Datos Agile
Conectar
Conectar Aprender Escalar Consumir
Datos de Streaming Datos Estructurados Datos No Estructurados
Línea de montaje para innovación basada en datos
Machine Learning
Deep Learning
Despliegue de Modelos
Monitorear la Performance
Reemplazar y Retirar
Refinar y Mejorar
Conectar
Conectar Aprender Escalar Consumir
Datos de Streaming Datos Estructurados Datos No Estructurados
Data Hub de Orquestación
Preparación de Datos Agile
Línea de montaje para innovación basada en datos
Machine Learning
Deep Learning
Interacción Personalizada
Visualizar y Responder
Automatización de Procesos de Negocio
Conectar
Conectar Aprender Escalar Consumir
Datos de Streaming Datos Estructurados Datos No Estructurados
Data Hub de Orquestación
Preparación de Datos Agile
Despliegue de Modelos
Monitorear la Performance
Reemplazar y Retirar
Refinar y Mejorar
Línea de montaje para innovación basada en datos
SAP Data Intelligence obtiene valor de los activos de datos distribuidos
Descubrirsu arquitectura de datos y sus interconexiones.
Refinarenriquecer, transformar, reutilizar, curar
Gobernary proteger los activos de datos de forma transparente con
cumplimiento
Orquestarsus datos utilizando pipelines modulares
Infraestructura de Kubernetes
SAP Data Intelligence
Aplicaciones InteligentesAplicaciones Empresariales, Reporting Ad-hoc, Planning, Analytics Predictivo, Big Data Analytics
Gobierno de Datos
Metadata Manageme
nt
Data Preparat ion
Access Governanc
e
Integración & Orquestación
Pipeline Modeling
Data W orkflows
API Access
Conexiones
Externas
Datos
Estructurados
Datos No
Estructurados
Datos de St reaming
Procesamiento de Pipelines & Gestión del Sistema
SAP Data Intelligence acelera y automatiza las iniciativas de inteligenciaartificial
Escalar IAa lo largo de suarquitectura
Entregar IAGestionar los modelos y la entrega
Plataforma de Data
ScienceDescubrir, explorar, experimentar
Aplicaciones InteligentesAplicaciones Empresariales, Reporting Ad-hoc, Planning, Analytics Predictiv o, Big Data Analytics
Infraestructura de Kubernetes
SAP Data Intelligence
Gobierno de Datos
M etadata M anagement
Data Preparation
Access Governance
Integración & Orquestación
Pipeline M odeling
Data Workflow s
API Access
Conexiones Externas
Datos Estructurados
Datos No Estructurados
Datos de Streaming
Procesamiento de Pipelines & Gestión del Sistema
Contenido de Machine Learning
ML Scenario Manager
ML Operations Cockpit
JupyterLab
SAP Data Intelligence –La IA Empresarial se combina con la Gestión Inteligente de la Información
Data Pipelining
Modelo de Gestión del Ciclo de Vida
Gobierno Centralizado de Metadatos
Pipelines flexibles que abarcan estructurado / no
estructurado / streaming, batch / (near-) real-time, OLTP y
OLAP, a través de cualquier implementación en la nube y
on premise.
Rastreo, navegación y perfilado de metadatos, l inaje de
datos, auditoría y enmascaramiento de datos.
[…], on
Descubrimiento y preparación de datos, notebooks,
implementación, (re) entrenamiento, servicio y
monitoreo.
Procesamiento de Datos Distribuidos y Heterogéneos
/Seidoranalytics1 @seidor_analytic @seidor_analytics www.seidoranalytics.comSEIDOR Analytics
¡Muchas Gracias!Más información:
Datos Olga Diaz