Download - SAP Data Intelligence

SAP Data Intelligence

NOSOTROS

Multinacional de servicios TIC de capital 100%

español fundada en 1982

Oficinas en Europa,

Latinoamérica, EEUU, Africa y

Oriente Medio

Presencia en 62 sedes

y 32 países

FACTURACIÓN

total de

464M€+4.700

PRODESIONALES

+500clientes BI

+150EXPERTOS

soluciones BI

+280proyectos en el

2019

en +30 sectores

¿En dónde estamos?

Nuestras Soluciones

• Business

Intelligence• Advanced/

predictive analytics • Big data

• Performance

management

• Risk

management• Enterprise data

management

• Data

Governance

Retos✓ Actúa en tiempo real

en un entorno cambiante.

✓ Anticípate a tendencias y

riesgos.

✓ Garantiza la seguridad en la

gestión de la información.

✓ Aumenta la inteligencia en

la toma de decisiones de

negocio.

Te asesoramos en todo el ciclo de InformaciónCon una metodología contrastada

Identificar

Diseñar

Desplegar

Implementar

Operar

1. Identificar iniciativas

claves en tu organización

2. Diseñar y generar plan de

trabajo para

3. Definimos el plan

de implementación

4. Desplegamos

La metodología y la

tecnología

5. Continuidad

operativa

Centro de Soporte

Servicios Gestionados

Proyectos Cerrado, Servicio Gestionado

con, metodología Agile y Design

Thinking.

Soluciones End to End

Paquetes de rápida implantación

¿Qué es Big Data?

Big Data es un término que describe el

gran volumen de datos, tanto

estructurados como no estructurados, que

inundan una empresa en el día a día.

Pero no es la cantidad de datos lo que

importa. Lo que las organizaciones hacen

con los datos es lo que realmente importa.

La Big Data se puede analizar para

obtener información que conduzca a

mejores decisiones y movimientos

estratégicos de negocios.

¿Las 5 “V” de Big Data?

• Velocidad: Velocidad con la que los datos se acumulan.

• Volumen: Escala de los datos o el aumento de la cantidad de datos almacenados.

• Variedad: Es la diversidad de los datos. Tenemos datos estructurados que encajan perfectamente

en filas y columnas, o bases de datos relacionales y datos no estructurados que no están

organizados de una manera predefinida, por ejemplo, Tweets, blogs, imágenes, números e incluso

datos de vídeo.

• Veracidad: Es la conformidad con los hechos y la exactitud. Con la gran cantidad de datos

disponibles, el debate se centra en la precisión de los datos en la era digital.

• Valor: Refiere a nuestra capacidad y necesidad para convertir los datos en valor. El valor no es sólo

el beneficio redituable, sino también. pueden ser beneficios médicos o sociales, o la satisfacción del

cliente, empleado o personal.

¿Qué es Hadoop?

Apache Hadoop es una plataforma desoftware de código abierto para elalmacenamiento distribuido yprocesamiento distribuido de grandesconjuntos de datos en clústeresinformáticos construidos del hardware deproductos básicos.

Los servicios de Hadoop prevénalmacenamiento de datos,procesamiento de datos, acceso a losdatos, gestión de datos, seguridad yoperaciones.

Hadoop – Distribución y ecosistemas

El empaquetado de tecnologías del

ecosistema Hadoop cuenta con una

capa de gestión añadida y soporte

empresarial.

Las principales son:

• Cloudera

• Hortonworks

• MapR

Un repositorio de almacenamiento en la nube, generalmente basado en tecnología Hadoop, que contiene una gran cantidad de datos en bruto en su formato nativo hasta que los mismos se necesiten. Sus ventajas son las siguientes:

Almacena económicamente datos ilimitados.

Recopilación de todos los datos "por si acaso”.

Almacenamiento de datos sin modelar - ”Schema on read”.

Complementa el Enterprise Data Warehouse.

Libera recursos de Enterprise Data Warehouse caros.

Rápido acceso de los usuarios a los datos.

Herramientas ETL/ELT de Hadoop.

Fácilmente escalable.

Con Hadoop, alta disponibilidad incorporada.

Data Lake es el centro de una solución de Big Data

Data Warehouse y Data Lake: cuando utilizar cada uno

Data Warehouse Característica Data Lake

Relacional, para Sistemas transaccionales, base de datos

operacionales, contiene información oficial para la toma

de decisión

Data

Datos relacionales y no relacionales, Audio,

v ideo, RRSS, IoT, logs, mobile. Repositorio para

desarrollo ágil de apps, análisis de información y

PoC

Su estructura se diseña y luego se crea Schema Diseñado en tiempo de ejecucion (análisis)

Tiempos de respuesta altisimo, mayor costo de

alamacenamientoPrice/Performance

Tiempos de respuestas altos menor costo de

almacenamiento

Datos altamente procesados sirve como la unica versiond

de la verdad.

Data QualityDatos brutos, semi-procesados y procesados

Analistas de negocios UsersData Scientists, Data Developers, y Analistas de

Negocio (poco frecuente)

Reportes en batch, BI y v isualizacion AnalyticsMachine Learning, Predictive Analytics, Data

Discovery y perfilamiento.

Machine Learning

Machine Learning es una disciplina científica del ámbito de la Inteligencia Artificial que crea sistemas que aprenden automáticamente.

Aprender en este contexto quiere decir identificar patrones complejos en millones de datos.

La máquina que realmente aprende es un algoritmo que revisa los datos y es capaz de predecir comportamientos futuros.

Automáticamente, también en este contexto, implica que estos sistemas se mejoran de forma autónoma con el tiempo, sin intervención humana.

Aplicación del Machine Learning

A continuación se muestran algunos de los principales problemas reales en los que distintas compañías

están aplicando Machine Learning en la actualidad:

• Utilización de imágenes en lugar de palabras clave para buscar productos de una empresa, o

artículos similares.

• Identificar marcas y logotipos de empresas en fotos publicadas en redes sociales.

• Orientación de anuncios y predicción de las preferencias de los clientes.

• Identificación y seguimiento de los niveles de confianza de los clientes, sus opiniones y actitud

en diferentes canales online y servicios de soporte automatizado al cliente.

• Identificación de clientes potenciales.

• Detección de fraudes, recomendaciones a clientes, gestión de relaciones con los clientes, etc.

• Identificación en textos de sentimientos positivos y negativos, temas y palabras clave.

• Localización de caras e identificación de emociones faciales.

• Reconocimiento de voz.

• Clasificación de vídeos.

Métodos del Machine Learning

Jupyter Notebook

El Jupyter Notebook es un entorno interactivo web de ejecución de

código en los que, por ejemplo, puedes incluir gráficas que ayuden

en el análisis e explicación de tus datos. Utilizados para facilitar la

explicación y reproducción de estudios y análisis.

Para trabajar con ellos se realiza

directamente desde el navegador. Estos notebook se pueden

almacenar e intercambiar o mostrar en páginas web.

Big Data y

Datos Diversos

Inteligencia

Aplicada

Procesos de

negocios

reinventados

Datos de SAP HR

Datos de antigüedad

de SFSF

Modelo R Best Fit

Datos de

localización

UOG vs.

Score de

empleados

Scoring de

conocimiento

Áreas y datos de

conocimiento

Mejora de HR con SAP Data Intelligence

El objetivo de negocio: encontrar los mejores dentro de la fuerza laboral que se ajustan para cubrir los puestos vacantes


El estado antes de Data Intelligence: integración manual y lotes semanales

Datos personales

del empleado y

datos del puesto

de trabajo

Datos de

antigüedad

del empleado

Áreas y datos

de

conocimiento

Scoring de

conocimiento

del empleado

Best Fit

Hoja de Excel con

los empleados BestFitting, actualizada

semanalmente

Actualizaciones

semanales

Extracción de

datos punto a

punto

Integraciones

manuales

punto a punto

Extracciones de

datos a archivos

de Excel



Datos personales

del empleado y datos del puesto

de trabajo

Datos de

antigüedad del empleado

Áreas y datos

de conocimiento

Scoring de

conocimiento del empleado

Best Fit

Datos de

distancias de Empleado -

Ubicación UOG

Escala de

scoring según ubicación

Lista de empleados

de mejor ajuste relacionada con el

código UOG de entrada

Matching en

tiempo real por

código UOG

Data Intelligence

pipelines

La solución con Data Intelligence: operacionalización optimizada, información en tiempo real

Vista de 360 grados de un consumidor

Big Data y Datos

Diversos

Inteligencia

Aplicada

Procesos de negocios

reinventados

Predecir el

comportamiento del

gasto del consumidor

Datos de la

tienda en línea

Datos de

seguimiento del

runner

Algoritmos de

clusteringbasados en ML

Predictive

Analytics

El objetivo de negocio: comprender y predecir el comportamiento del consumidor y el perfil del gasto


Centro Datos Empresarial

Consumidor

Consumidor

Venta

Online

Data Warehouse Cloud

Seguimiento

del Runner

Datos de ventas

del cliente

Snowflake

Datos en

ejecución

Descubrimiento de

hábitos de running

Sin minería de

conjuntos de datos

combinados, sin

análisis avanzado

Información de

ventas del cliente


Data Intelligence

pipelines

Consumidor

Consumidor

Venta

Online

Seguimiento

del Runner

Data Warehouse Cloud

Centro Datos Empresarial

Snowflake

Datos en

ejecución

Análisis y

predicción del

comportamiento

del consumidor

Vista 360

Ejecución y

entrenamiento

de MLDatos de ventas

del cliente

Gestión simplificada

del ciclo de vida de

ML

El proyecto con Data Intell igence: Data Science simplificado en toda la arquitectura.

Centro de simulación de energías renovables

Big Data y Datos

Diversos

Inteligencia

Aplicada

Procesos de negocios

reinventados

Desarrollo de

infraestructura inteligente

Producción de

energía (eMeter /

Kafka)

Datos de carga de red(Scada / OsiSoft)

Algoritmos de

clusteringbasados en ML

Predictive Analytics

Activos y

capacidad (ERP y non-

SAP CRM)

Consumo de

energía del cliente (SAP IS-U and CRM)

El objetivo de negocio: ayudar a los municipios a mejorar su producción renovable

Centro de simulación de energías renovables

Data Intelligence

pipelines

Centro de

simulación de

energías

renovables

Desarrollo de

infraestructura

inteligente

Calcular la

producción de

energía

Datos de carga

de red

Consumo de

energía

Calcular

capacidad por

municipio

Producción

de Energía

Datos de

activos

Consumo de

energía

Predicciones

de carga de

cuadrícula

Datos de

activos

CRM

La implementación: ¡los municipios obtienen una visión de extremo a extremo sobre el posible desarrollo!

La evolución de la gestión de datos en entornos empresariales

Diversidad

de Datos

Inteligencia Empresarial

Integración de AplicacionesMFT, EAI, ESB, SOA, B2B,

BPM/BRM…

Integración de AnalyticsETL, EDW, BI, MIS, Data

Marts…

Orquestación de Datos(HTAP, Big Data, Cloud etc.)

Streaming, IoT, ML, Big Data,

Advanced Analytics…

Advanced Analytics y ML desafían la Gestión de Datos a un grado completamente nuevo!

• Streaming estructurado y no

estructurado.

• Batch, (near) real-time

• Transaccional, Analítico,

Híbrido

Integración

• Varios motores heterogéneos

• Diversos patrones de

procesamiento (fuera de línea,

lambda, controlado por

eventos ...)

Procesamiento

• Descubrir los conjuntos de

datos disponibles y descubra

su semántica

Descubrimiento

• Inconsistencias de datos y

fragmentación

• Conjuntos de datos sesgados

• Ciclo de v ida del modelo ML

Calidad

• Privacidad y protección de

datos.

• Linaje de datos y auditoría

Conformidad

• Arquitecturas distribuidas, en la

nube y on-premise

• Escalamiento elástico

• Monitoreo

Operaciones

Gestión Inteligente de Información

• Las herramientas de colaboración entregan

datos confiables

• Pipelines de datos modulares

• Arquitectura en diferentes fuentes de datos

• Gobernar y gestionar metadatos

1 Data Ops 2 Data Catalog 3 Data Fabric 4 Data Orchestration

C O L A B O R A C I O N O R Q U E S T A C I Ó N

Gestión Inteligente de Información Data Ops • Data Catalog • Data Fabric. • Data Orchestration

Descripción General: SAP Data Intelligence

conectar | extraer valor |

escalar

Inteligencia Artificial Empresarial

Desarrollo de Machine Learning | Despliegue de modelo | Gestión del ciclo de vida

Cualquier tipo de

fuente de datos(estructurado, no

estructurado, streaming)

SAP y datos de

aplicaciones de terceros

Descubrir, acceder,

y preparar

Transformar y

proceso

Implementar, escalar

y gestionar

Gestión Inteligente de Información

Data Ops • Data Catalog • Data Fabric. • Data Orchestration

Descripción General: SAP Data Intelligence

Línea de montaje para innovación basada en datos

Datos de Streaming Datos Estructurados Datos No Estructurados

Conectar

Conectar Aprender Escalar Consumir

Machine Learning

Deep Learning

Data Hub de Orquestación

Preparación de Datos Agile

Conectar




Machine Learning

Deep Learning

Despliegue de Modelos

Monitorear la Performance

Reemplazar y Retirar

Refinar y Mejorar

Conectar






Machine Learning

Deep Learning

Interacción Personalizada

Visualizar y Responder

Automatización de Procesos de Negocio

Conectar





Despliegue de Modelos

Monitorear la Performance

Reemplazar y Retirar

Refinar y Mejorar


SAP Data Intelligence obtiene valor de los activos de datos distribuidos

Descubrirsu arquitectura de datos y sus interconexiones.

Refinarenriquecer, transformar, reutilizar, curar

Gobernary proteger los activos de datos de forma transparente con

cumplimiento

Orquestarsus datos utilizando pipelines modulares

Infraestructura de Kubernetes


Aplicaciones InteligentesAplicaciones Empresariales, Reporting Ad-hoc, Planning, Analytics Predictivo, Big Data Analytics

Gobierno de Datos

Metadata Manageme

nt

Data Preparat ion

Access Governanc

e

Integración & Orquestación

Pipeline Modeling

Data W orkflows

API Access

Conexiones

Externas

Datos

Estructurados

Datos No

Estructurados

Datos de St reaming

Procesamiento de Pipelines & Gestión del Sistema

SAP Data Intelligence acelera y automatiza las iniciativas de inteligenciaartificial

Escalar IAa lo largo de suarquitectura

Entregar IAGestionar los modelos y la entrega

Plataforma de Data

ScienceDescubrir, explorar, experimentar

Aplicaciones InteligentesAplicaciones Empresariales, Reporting Ad-hoc, Planning, Analytics Predictiv o, Big Data Analytics

Infraestructura de Kubernetes


Gobierno de Datos

M etadata M anagement

Data Preparation

Access Governance

Integración & Orquestación

Pipeline M odeling

Data Workflow s

API Access

Conexiones Externas

Datos Estructurados

Datos No Estructurados

Datos de Streaming

Procesamiento de Pipelines & Gestión del Sistema

Contenido de Machine Learning

ML Scenario Manager

ML Operations Cockpit

JupyterLab

SAP Data Intelligence –La IA Empresarial se combina con la Gestión Inteligente de la Información

Data Pipelining

Modelo de Gestión del Ciclo de Vida

Gobierno Centralizado de Metadatos

Pipelines flexibles que abarcan estructurado / no

estructurado / streaming, batch / (near-) real-time, OLTP y

OLAP, a través de cualquier implementación en la nube y

on premise.

Rastreo, navegación y perfilado de metadatos, l inaje de

datos, auditoría y enmascaramiento de datos.

[…], on

Descubrimiento y preparación de datos, notebooks,

implementación, (re) entrenamiento, servicio y

monitoreo.

Procesamiento de Datos Distribuidos y Heterogéneos

/Seidoranalytics1 @seidor_analytic @seidor_analytics www.seidoranalytics.comSEIDOR Analytics

¡Muchas Gracias!Más información:

[email protected]

Datos Olga Diaz

Download - SAP Data Intelligence

Top Related