zith ppr - sas.com · gestionando el ciclo de vida analítico para ... toma de decisiones de...

14
white paper Gestionando el Ciclo de Vida Analítico para las Decisiones a Escala: Cómo i r de los datos a las decisiones t an rápido como sea p osible

Upload: lykhue

Post on 07-Oct-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

white paper

Gestionando el Ciclo de Vida Analítico para las Decisiones a Escala:Cómo ir de los datos a las decisiones tan rápido como sea posible

ContenidoIntroducción ........................................................................1

Decisiones a Escala ...........................................................2

¿Cuáles son los Desafíos? .........................................2

El Ciclo de Vida Analítico de SAS®:

Mejores Prácticas para Mejorar sus Resultados del

Modelado Predictivo .........................................................4

La Fase de Descubrimiento del Ciclo de Vida Analítico ........................................................................4

La Fase de Implementación del Ciclo de Vida Analítico ........................................................................5

Del Concepto a la Acción: cómo crear un entorno

Analítico Eficiente ..............................................................6

Cómo SAS® Puede Ayudar en el Ciclo de Vida

Analítico ...............................................................................7

Preparación y Exploración de los Datos: un Enfoque Sistemático ..................................................7

Desarrollo de Modelos con un Workbench Analítico Innovador ....................................................8

Implementación de Modelos desde un Entorno de fácil uso .................................................8

¡Acción! Poniendo en Uso sus Resultados del Modelado Tan Rápido como Sea Posible .............9

Gestión y Evaluación de Modelos: Un Proceso Constante .....................................................................9

Casos Prácticos ................................................................ 10

Institución Financiera del Reino Unido: Modernizando su Ciclo de Vida Analítico .......... 10

Orlando Magic: La Magia Detrás de la Magia .. 10

Más Información.............................................................. 10

1

IntroducciónConsidere este escenario:

Una organización cuenta con cientos de modelos analíticos integrados en los sistemas de producción para apoyar en la toma de decisiones de marketing, precios, riesgo de crédito, riesgo operativo, fraude y finanzas

Los analistas de diferentes unidades de negocio desarrollan sus modelos sin procesos formales o estandarizados para almacenarlos, implementarlos y gestionarlos. Algunos modelos no tienen la documentación que describa al propietario del modelo, el propósito, los lineamientos de uso u otra información necesaria para gestionar el modelo o explicarlo a los reguladores.

Los resultados de los modelos se entregan a los encargados de tomar las decisiones con controles y requerimientos limitados. Debido a que se utilizan diferentes conjuntos de datos y de variables para crear los modelos, los resultados son inconsistentes. Hay poca validación o backtesting para comprobar su precisión.

Se toman las decisiones de acuerdo con los resultados de los modelos que se han recibido – y todos esperan obtener los mejores.

Para muchas organizaciones esta confusión en el modelado les puede resultar muy familiar. En un entorno de modelado diverso y que se gestiona relajadamente, puede ser complicado responder a las preguntas críticas sobre los modelos de analítica predictiva de la cual depende su organización. Preguntas como:

• ¿Quién creó los modelos y por qué?• ¿Qué variables de entrada se utilizan para hacer las predicciones

y, finalmente, tomar decisiones?• ¿Cómo se utilizan los modelos?• ¿Cómo se están desempeñando los modelos, y cuándo se

actualizaron por última vez?• ¿Dónde está la documentación de apoyo?• ¿Por qué toma tanto tiempo poner en producción los modelos

nuevos o actualizados?

La organización que no pueda responder a esas preguntas con seguridad no puede estar segura de que sus modelos analíticos están ofreciendo un valor real.

Los modelos analíticos están en el corazón de las decisiones de negocio críticas. Pueden identificar nuevas oportunidades, ayudarle a forjar nuevas o mejores relaciones con sus clientes, y permitirle manejar

la incertidumbre y los riesgos. Por estas razones y más, deberían crearse y tratarse como activos organizacionales de alto valor. ¿Pero cómo puede hacerlo usted?

Para los principiantes, usted necesita software poderoso y fácil de usar que pueda ayudarle a dar forma a sus datos y crear rápidamente varios modelos predictivos precisos. Por tanto, se necesitan procesos poderosos e integrados para gestionar sus modelos analíticos para lograr un desempeño óptimo a lo largo de su ciclo de vida completo. Los equipos de TI y de analítica necesitan procesos eficientes y repetibles así como una arquitectura confiable para gestionar los datos, comunicar la lógica y delinear los modelos analíticos predictivos durante el ciclo de implementación.

Y lo más importante, la clave para el éxito analítico es convertir rápidamente los datos en conocimientos y acciones, lo que significa que usted debe integrar de manera eficiente los modelos predictivos precisos en los sistemas de producción que sustentan sus decisiones automáticas.

Utilice sus Modelos para Tomar Decisiones

Automáticamente Las decisiones operativas son decisiones altamente

repetibles, que con frecuencia se toman varias

veces al día. La gente puede tomar estas decisiones

(por ejemplo, los empleados de los centros de

atención telefónica hacen ventas directas o cruzadas

a los clientes en el teléfono), o éstas pueden ser

completamente automáticas al imitar la lógica de

decisión humana (por ejemplo, una compra con tarjeta

de crédito es rechazada). Sin embargo, una decisión

operativa no tiene que girar alrededor de un solo

cliente – sino de un grupo de clientes que recibe una

oferta específica. Estos tipos de decisiones son llevados

a los sistemas de gestión de campañas cada semana

o mes. Cuando los modelos analíticos predictivos se

integran en los sistemas de producción, y un proceso

de negocio utiliza los resultados para producir

respuestas instantáneas, usted tiene modelos analíticos

que se han implementado efectivamente.

2

La creciente complejidad y magnitud de gestionar potencialmente cientos o miles de modelos que cambian constantemente ponen a las organizaciones en la cúspide de una revolución informática. El viejo enfoque manual ineficiente debe evolucionar para convertirse en un proceso automático más efectivo.

4. Una manera de gestionar y monitorear los modelos analíticos para asegurar que tengan un buen desempeño y que continúanentregando las respuestas correctas.

Una arquitectura y procesos que puedan crecer para satisfacer las nuevas necesidades, como transmitir datos y crear modelos predictivos más detallados más rápidamente que nunca.

¿Cuáles son los Desafíos?Desafortunadamente, aunque los datos abundan y todos reconocen que son necesarios, la capacidad de convertir datos voluminosos y desarticulados en conocimientos útiles que permitan tomar mejores decisiones automáticas no es fácil. Existen varios desafíos:

• Retrasos. Debido a que con frecuencia los procesos son manuales y ad hoc, se necesitan meses para implementar un modelo en los sistemas de producción. Debido a que es muy tardado mover modelos a lo largo de las fases de desarrollo y de testeo, pueden estar caducos para cuando lleguen a producción. O nunca implementarse. Los problemas de cumplimientos internos y externos pueden hacer aún más complicado el proceso.

• Dificultad para definir un disparador. El paso de traducir respuestas de los modelos analíticos a acciones de negocio para tomar decisiones operativas requiere de reglas de negocios claras y consensadas. Estas reglas de negocio necesitan ser parte del entorno gobernado ya que definen la manera en que se utilizan los resultados de los modelos. Por ejemplo, un modelo de detección de fraudes podría dar como resultado una calificación de riesgo de fraude con un número entre 100 y 1,000 (similar a la calificación de crédito FICO). Depende del negocio decidir qué nivel de riesgo requiere de acciones. Si el disparador para una alerta de fraude se configura demasiado alto, el fraude podría pasar desapercibido. Si el disparador por fraude está configurado demasiado bajo, las alertas crean demasiados falsos positivos. Pero los resultados reducirán el valor que estos modelos crean y también reducirán la confianza en dichos resultados.

• Resultados pobres. Los modelos con un rendimiento pobre permanecen en producción con mucha frecuencia, aunque estén produciendo resultados inexactos que llevan a tomar malas decisiones de negocio. Los resultados de los modelos cambiarán a medida que los datos cambien a nuevas condiciones y comportamientos. Las principales razones de esta situación son la falta de un repositorio central para los modelos y la ausencia de métricas consistentes para determinar cuándo un modelo necesita actualizarse o remplazarse.

Decisiones a Escala¿Cuántas decisiones operativas se toman a diario en su organización? Probablemente más de las que usted siquiera puede imaginar. Por ejemplo, una institución financiera. ¿Cuántas transacciones con tarjetas de crédito se procesan cada hora? (En Visa, la tasa de transacciones puede alcanzar las 14,000 por segundo. Vea la página 3). Cada una representa una decisión operativa – permitir o rechazar la transacción de acuerdo con la calificación de riesgo de fraude calculado. Y si bien cada decisión operativa o transacción puede tener un bajo riesgo individual, el gran número de estas decisiones que se toman cada hora o cada día aumentan considerablemente el riesgo asociado.

Es por eso, que la capacidad de producir buenas decisiones operativas rápidamente, al tiempo de incorporar volúmenes de datos en constante crecimiento, puede marcar la diferencia entre el fraude y el no fraude – en el éxito o fracaso de una empresa.

Entonces, ¿qué se necesita para tomar rápidamente muchas buenas decisiones operativas que reflejen consistentemente la estrategia del negocio y al mismo tiempo mantener funcionando a su organización felizmente y mejor que nadie más?

1. Aplicaciones operativas que utilizan datos para producir respuestas para la gente (o los sistemas) de modo que se realicenlas acciones correctas.

2. Modelos analíticos reveladores y actualizados de los que puedadepender el negocio para tomar decisiones óptimas en el momento correcto.

3. La integración de reglas de negocio y analítica predictiva en losflujos de decisiones operativas que brinden la visión necesaria para tomar decisiones pensadas y confiables.

“Las decisiones operativas son lo que hacen a su estrategia de negocio real y aseguran que su organización opere de manera efectiva”.

James Taylor y Neil Raden,Smart (Enough) Systems

3

• Confusión. Las organizaciones se encuentran en un modo reactivo – respondiendo apresuradamente a las fechas límite de las agencias externas. Cada grupo tiene un modo distinto de manejar y validar un modelo. Esto genera reportes únicos con diferentes niveles de detalle para revisión o modelos que son descritos inconsistentemente, lo que dificulta la traducción de TI. Nadie está seguro de por qué se seleccionó el modelo campeón, cómo se calculó una calificación particular o qué rige a las reglas de negocio que detonaron el modelo.

• Falta de transparencia. Existe poca visibilidad de las etapas de desarrollo de modelos o del conocimiento que toca al modelo cuando pasa por su ciclo de vida. Surgen suposiciones contradictorias. Se debe llamar a evaluadores imparciales para validar los modelos a medida que pasan por cada grupo, lo que es un gran desperdicio de recursos.

• Pérdida de conocimiento importante de los modelos. Con una documentación insuficiente para los modelos, la propiedad intelectual importante está en la mente del propietario del modelo. Cuando esa persona deja la empresa, el conocimiento se va con ella.

• Escasez de habilidades analíticas. Incluso siendo cada vez más los científicos de datos que se incorporan al mercado laboral, la escasez de habilidades analíticas necesarias para la creación e implementación de modelos es aún un enorme desafío para muchas organizaciones.

Visa: Miles de Millones de Decisiones

Operativas al Año Mejoran la Experiencia de

los Clientes y Reducen los Fraudes Una empresa reconocida mundialmente, Visa facilita

la transferencia electrónica de fondos a través de

productos de marca que son producidos por las

miles de instituciones financieras con las que se ha

asociado. La compañía procesó 64 mil 900 millones

de transacciones en 2014, y $4.7 billones en compras

hechas con las tarjetas de Visa ese mismo año.

Visa tiene la capacidad de cómputo para procesar

56,000 transacciones por segundo, lo que es más

de cuatro veces la tasa pico de transacciones

hasta la fecha. Visa no sólo procesa y calcula – está

usando continuamente la analítica para compartir

conocimientos estratégicos y operativos con sus

instituciones financieras socias, y ayudarles a mejorar el

rendimiento.

Este objetivo de negocio es apoyado por un sistema

de gestión de datos robusto. Visa también ayuda

a sus clientes a mejorar el rendimiento y brindar

un conocimiento analítico profundo. “Entendemos

los patrones de comportamiento al realizar el

agrupamiento y la segmentación a un nivel granular,

y ofrecemos este conocimiento a las instituciones

financieras que son nuestras socias”, asegura Nathan

Falkenborg, director de Visa Performance para el Norte

de Asia.

En una reciente prueba de concepto, Visa utilizó una

solución de alto desempeño de SAS que depende del

cómputo en-memoria para potenciar los algoritmos

estadísticos y de machine-learning, y presentar la

información visualmente. Falkenborg agrega, “El

desafío que tenemos, como cualquier compañía que

gestiona y utiliza conjuntos de datos masivos, es cómo

podemos utilizar toda la información necesaria para

resolver un problema de negocio – ya sea mejorar

nuestros modelos de fraude, o ayudar a un cliente a

comunicarse de manera efectiva con sus clientes”.

Lea más información.

4

El Ciclo de Vida Analítico de SAS®: Mejores Prácticas para Mejorar sus Resultados del Modelado PredictivoLas organizaciones exitosas reconocen que los modelos analíticos son recursos corporativos esenciales que producen y entregan respuestas a los sistemas de producción para mejorar las relaciones con los clientes, las operaciones, aumentar los ingresos y disminuir los riesgos. Así que, por supuesto, buscan crear los mejores modelos posibles.

Sin embargo, pocos pueden gestionar totalmente todas las complejidades del ciclo de vida analítico completo. Es una tarea con múltiples facetas.

En SAS hemos desarrollado un ciclo de vida analítico interactivo que lo guiará paso a paso por el proceso de los datos a la toma de una decisión. Comenzamos por señalar que el ciclo de vida analítico tiene dos lados – el descubrimiento y la implementación. Veamos las tareas para ambos lados y cómo interactúan para crear un proceso iterativo que usted puede utilizar para producir resultados predictivos repetibles y confiables.

La Fase de Descubrimiento del Ciclo de Vida Analítico• Haga una pregunta. El proceso de descubrimiento consiste en

hacer preguntas de negocio que generen innovaciones. Así que el primer paso es definir qué necesita saber el negocio. Y después traducir la pregunta a una representación matemática del problema, lo que puede resolverse con la analítica predictiva. Los empresarios también necesitan especificar la necesidad, el ámbito, las condiciones del mercado y los objetivos relacionados con una pregunta de negocio que están tratando de responder, lo cual ayuda en la selección de las técnicas de modelado más adecuadas.

• Prepare los datos. Tecnologías como Hadoop y computadoras más veloces y accesibles han hecho posible almacenar y utilizar más datos, y más tipos de datos, que nunca antes. Pero esto sólo ha aumentado la necesidad de unir datos de diferentes formatos,de diferentes fuentes y transformar datos brutos para que puedan utilizarse como entradas para el modelado predictivo. Con los nuevos tipos de datos de los dispositivos conectados, como los sensores de las máquinas o registros de las interacciones en línea, la etapa de preparación de los datos se complica aún más.

Preparar

Explorar

Modelar Evaluar

Actuar

Implementar

Descubrimiento

Datos

ImplementaciónPreguntar

Figura 2: El ciclo de vida analítico es un proceso iterativo de hacer descubrimientos en sus datos y aplicar nuevos conocimientos para mejorar continuamente los modelos predictivos y sus resultados.

5

Muchas organizaciones aún reportan que gastan una cantidad excesiva de tiempo, algunas veces hasta 80 por ciento, realizando tareas de preparación de datos. La mayor parte del tiempo de la fase de descubrimiento debe invertirse en explorar los datos y crear buenos modelos en lugar de preparar los datos.

• Explore los datos. Las herramientas interactivas de visualizaciónde autoservicio necesitan servir a una amplia gama de usuarios (desde los analistas de negocio sin conocimiento estadístico hasta los científicos de datos con alto conocimiento analítico) de modo que usted pueda buscar fácilmente relaciones, tendencias y patrones para entender más a fondo los datos. En este paso, se refinará la pregunta y el enfoque formado en la fase inicial de “preguntar” del proyecto. Las ideas sobre cómo abordar el problema de negocio desde una perspectiva analítica se desarrollan y se prueban. Mientras examina los datos, puede encontrar la necesidad de añadir, eliminar o combinar variables para crear modelos enfocados con mayor precisión. Las herramientas interactivas veloces ayudan a hacer éste un procesoiterativo, lo cual es crucial para identificar las mejores preguntas y respuestas.

• Modele los datos. En esta etapa, se aplican a los datos numerososalgoritmos analíticos y de modelado de machine-learning para encontrar la mejor representación de las relaciones en los datos que ayudarán a responder a la pregunta de negocio. Las herramientas analíticas buscan una combinación de datos y técnicas de modelado que predicen un resultado deseado. No hay una sola plataforma que siempre tenga el mejor desempeño. El “mejor” algoritmo para resolver el problema de negocio depende de los datos. La experimentación es vital para encontrar la respuesta más confiable, y la creación de modelos automáticos puede ayudar a reducir el tiempo para obtener los resultados y aumentar la productividad de los equipos analíticos.

En el pasado, con las herramientas manuales para crear modelos, los mineros de datos y los científicos de datos podían crear varios modelos en una semana o en un mes. El software mejorado y las computadoras más veloces han acelerado el proceso de creación de modelos de modo que cientos o incluso miles de modelos pueden crearse hoy en la misma cantidad de tiempo. Pero esto origina otro problema - ¿cómo pueden encontrar de manera rápida y confiable un modelo (de muchos) que tenga el mejor desempeño? Los “torneos” de modelos ofrecen una manera de comparar diversos algoritmos competitivos con la oportunidad de elegir uno que ofrezca los mejores resultados para un conjunto específico de datos. Con los torneos automatizados de algoritmos de machine-learning y métricas claramente definidas para identificar al modelo campeón, esto se ha convertido en un proceso sencillo. Los analistas y los científicos de datos pueden invertir su tiempo en hacer preguntas e investigaciones más estratégicas.

La Fase de Implementación del Ciclo de Vida Analítico• Implemente sus modelos. Aquí es donde usted puede tomar los

conocimientos aprendidos de la fase de descubrimiento y ponerlos en acción usando procesos repetibles y automáticos. En muchas organizaciones este es el punto en el que el proceso de modelado analítico se frena debido a que no hay una transición definida entre el descubrimiento y la implementación, o la colaboración entre los desarrolladores de modelos y los arquitectos de implementación de TI, mucho menos una automatización optimizada. En la mayoría de las organizaciones el entorno de implementación es muy distinto al entorno de descubrimiento, especialmente cuando los modelos predictivos están apoyando la toma de decisiones operativas. Con frecuencia TI tiene que aplicar políticas de gobierno rigurosas en su entorno para asegurar acuerdos de nivel de servicio con el negocio. Al integrar las fases de descubrimiento y de implementación, usted puede crear una transición automática, flexible y repetible que mejora las decisiones operativas. Además, para todos es importante contar con un proceso transparente de gobernado - especialmente los auditores. Una vez que se ha creado, el modelo se registra, se prueba o se valida, se aprueba y se declara listo para utilizarse con los datos de producción (integrado en los sistemas operativos).

• Utilice la nueva información. Existen dos tipos de decisiones que pueden tomarse de acuerdo con los resultados analíticos. Las decisiones estratégicas son tomadas por los humanos que examinan los resultados y actúan, normalmente viendo al futuro. Las decisiones operativas son automáticas – como las calificaciones de crédito o las mejores ofertas recomendadas. No requieren de la intervención humana porque las reglas que los humanos aplicarían pueden codificarse en los sistemas de producción. Son cada vez más las organizaciones que buscan automatizar las decisiones operativas y brindar respuestas y resultados en tiempo real para reducir las latencias de las decisiones. Basar las decisiones operativas en las respuestas de los modelos analíticos también hace a las decisiones objetivas, repetibles y cuantificables. La integración con herramientas de gestión de decisiones empresariales permite a las organizaciones crear flujos completosde decisiones operativas. Estos combinan los modelos analíticos con disparadores basados en reglas de negocio para producir las mejores decisiones automáticas. Y debido a que esto se define formalmente dentro de la herramienta de gestión de decisiones, las actualizaciones y los refinamientos para las condiciones cambiantes son sencillos – mejorando así la agilidad del negocio y el gobierno. Una vez aprobado para producción, la herramienta de gestión de decisiones aplica el modelo a los nuevos datos operativos, generando los conocimientos predictivos necesarios para realizar mejores acciones.

6 6

• Evalúe sus resultados. El siguiente paso y tal vez el más importante es evaluar el resultado de las acciones que produjo el modelo analítico. ¿Sus modelos predictivos produjeron las predicciones correctas? ¿Se lograron resultados tangibles, como mayores ingresos y menores costos? Con el monitoreo y medición continuos del desempeño de los modelos basados en métricas estandarizadas, usted puede evaluar el éxito de estos recursos para su negocio. Esta evaluación puede entonces alimentar la próxima iteración del modelo, creando un circuito continuo de machine-learning. Si usted identifica la degradación de los modelos analíticos, puede definir la estrategia óptima para actualizarlos para que sigan produciendo los resultados deseados. Con un número cada vez mayor de modelos analíticos, la automatización es necesaria para identificar rápidamente los modelos que necesitan mayor atención, e incluso brindar un reentrenamiento automático.

• Pregunte una vez más. Los modelos predictivos no son para siempre. Los factores que contribuyen a hacer las predicciones en un modelo cambian con el tiempo, sus clientes cambian con el tiempo, los competidores entran y salen del mercado, y hay nuevos datos disponibles. Usted tiene que actualizar incluso los modelos más precisos, y las organizaciones necesitarán pasar por los pasos de descubrimiento e implementación una vez más. Es un proceso constante y en evolución. Si un modelo se degrada, se vuelve a calibrar cambiando los coeficientes de los modelos o reconstruyendo sus características existentes y nuevas. Cuando un modelo ya no sirve a una necesidad del negocio, se retira.

Es fácil imaginar las muchas formas en que este proceso puede salir mal. A menudo las organizaciones tardan meses, algunas veces años, en pasar por este proceso integral. Existen muchos factores desfavorables:

• La necesidad de que las fuentes de datos puedan estar disemina-das por su organización.

• Los datos pueden necesitar ser integrados y limpiados varias veces para soportar una variedad de requerimientos analíticos.

• Puede demorar mucho la traducción manual de los modelos a diferentes lenguajes de programación para integrarse con siste-mas operativos críticos, que pueden incluir sistemas en lote y en tiempo real.

• Las organizaciones podrían tardar en reconocer cuándo un modelo necesita cambiarse, así que siguen adelante con malas decisiones basadas en resultados de modelos obsoletos.

• Muchos de los pasos del ciclo de vida analítico son iterativos por naturaleza y podrían requerir regresar al paso previo del ciclo para agregar y/o actualizar datos.

• Diferentes personajes añaden complejidad al proceso, lo que hace muy importantes a la colaboración y a la documentación. En muchas organizaciones, la preparación de los datos en la fase de descubrimiento es manejada por la unidad de TI, mientras que

la exploración de datos y el desarrollo de modelos normalmente son responsabilidad de los analistas de negocio y de los científi-cos de datos. La implementación, especialmente cuando incluye la integración en los procesos de negocio operativos, es mane-jada por TI una vez más (aunque éste podría ser un grupo de TI distinto al grupo de gestión de datos que provee los datos)

El efecto neto es que los modelos, que se suponen producen conocimientos de negocio sólidos, se deriva en decisiones menos óptimas, oportunidades perdidas y acciones equivocadas. ¡Pero no tiene que ser así!

Del Concepto a la Acción: Cómo Crear un Entorno Analítico EficienteEn un entorno analítico efectivo, se crean rápidamente los datos y se accede a ellos en la estructura correcta para la exploración y el desarrollo de modelos. Los modelos se crean y se prueban rápidamente, y se despliegan en un entorno de producción con un retraso mínimo. Los modelos de producción generan rápidamente un resultado confiable. El desempeño de los modelos se monitorea constantemente, y los modelos con un rendimiento insuficiente son remplazados rápidamente por modelos más actualizados.

En resumen, una estrategia analítica exitosa es algo más que crear un modelo poderosamente predictivo; se trata de gestionar cada una de estas etapas del ciclo de vida de manera holística para un modelo particular y a través del portafolio completo de modelos. Y esto no es sencillo.

Tenga en cuenta que los analistas y los científicos de datos no sólo desarrollan un modelo para resolver un problema de negocio. Desarrollan una serie de modelos competitivos y utilizan diferentes técnicas para resolver problemas complejos. Tendrán modelos en varias etapas de desarrollo y modelos a la medida de las diferentes líneas de productos y problemas de negocio. Una organización puede encontrarse pronto gestionando miles de modelos.

Además, el entorno de modelos no es estático. Los modelos se actualizan continuamente a medida que son probados y que están disponibles los resultados y datos nuevos. El objetivo es crear los mejores modelos predictivos, usando los mejores datos disponibles.

Los modelos predictivos son activos organizacionales de alto valor, y el éxito requiere más que solamente depender del elemento tecnológico. Las organizaciones también deben observar de cerca a la gente y los procesos. Por ejemplo, es importante actualizar constantemente las habilidades empresariales y analíticas para identificar los problemas de negocio más importantes y puedan aplicarse los conocimientos a los procesos operativos.

7

El ciclo de vida analítico es iterativo y colaborativo por naturaleza. Los miembros del personal con diferentes experiencias y habilidades participan en varias etapas del proceso. Un director tiene que identificar claramente el problema que requiera los conocimientos obtenidos con la analítica, después tomar la decisión de negocio apropiada y monitorear los resultados de dicha decisión. Un analista de negocio conduce la exploración y visualización de datos y trabaja para identificar las variables clave que influyen en los resultados. Los equipos de TI y de gestión de datos ayudan a facilitar la preparación de los datos y la implementación y el monitoreo de los modelos. Un científico de datos o un minero de datos realiza el análisis exploratorio más complejo, la segmentación descriptiva y el modelado predictivo.

Para obtener los mejores resultados analíticos, las organizaciones necesitan contar con la gente con las habilidades adecuadas, y permitirles trabajar conjuntamente para realizar funciones.

Cómo SAS® Puede Ayudar en el Ciclo de Vida AnalíticoSAS utiliza componentes integrados para reducir el tiempo para obtener valor del ciclo de vida del modelado – eliminando los pasos redundantes y apoyando la cohesión en la cadena de información de los datos a la gestión de decisiones. Los procesos consistentes y las tecnologías para el desarrollo e implementación de modelos reducen los riesgos involucrados en el proceso de modelado al tiempo de apoyar la colaboración y el gobierno entre los miembros clave del negocio y de TI.

Preparación y Exploración de los Datos: Un Enfoque Sistemático• Preparación de los datos. SAS® Data Management le permite

perfilar y limpiar los datos y crear rutinas de extracción, carga y transformación (ELT) que producen data marts analíticos, usando sólo los datos que se requieren de la base de datos. Los datos se organizan en las bases de datos para la carga rápida, se trans-forman para ajustarse a la estructura para crear modelos y se resumen para crear campos derivados. Estos procesos pueden automatizarse y programarse en lote o ejecutarse ad hoc en tiempo real, dependiendo de la etapa del ciclo de vida analítico. La preparación de datos de autoservicio y las herramientas de administración de datos como SAS Data Loader for Hadoop ayu-dan a los analistas de negocio y a los científicos de datos a agilizar el acceso, la combinación y la limpieza de datos sin agobiar a TI. Incluso el procesamiento de flujos de SAS lleva a una capacidad de volumen de cientos de millones de eventos por segundo – con tiempos de respuesta de baja latencia. Le ayuda a saber qué necesita de atención inmediata, qué puede ignorarse y qué debería almacenarse. Finalmente, el procesamiento en la base de datos se utiliza para reducir el movimiento de los datos y mejorar el desempeño.

• Exploración de datos. SAS Visual Analytics le permite a los analis-tas de negocio descubrir fácilmente relaciones importantes en los datos y concentrarse rápidamente en áreas de oportunidad o de preocupación, descubrir patrones inesperados, examinar distribu-ciones de datos, encontrar la prevalencia de valores extremos e identificar variables importantes para incorporarlos en el proceso de desarrollo de modelos.

Figura 2: SAS Data Loader utiliza instrucciones integradas para reducir las necesidades de entrenamiento. Este es un ejemplo de la directiva de “emparejar-combinar datos”, lo que le permite combinar dos tablas en una sola, y correr dentro de Hadoop para tener un mejor desempeño.

Figura 3: Explore los datos desde un entorno de visualización de datos interactivo.

8

Desarrollo de Modelos con un Workbench Analítico InnovadorLos analistas pueden crear modelos predictivos usando una variedad de

herramientas de SAS que incluyen un conjunto integral de algoritmos para

analizar datos estructurados y no estructurados.

• Torneos automáticos de machine-learning. Con SAS Factory Miner,

usted tiene un entorno de modelado predictivo e interactivo que

hace extremadamente fácil crear, modificar y evaluar cientos – e

incluso miles – de modelos muy rápidamente. Con solo algunos clics,

usted puede acceder, modificar y transformar sus datos, elegir qué

técnicas de machine-learning quiere aplicar, y ejecutar los modelos en

un entorno de torneo de modelos automático para identificar

rápidamente al mejor. Pueden crearse plantillas que utilizan líneas de

modelado de mejores prácticas y compartirlas con otros usuarios del

sistema sin escribir una sola línea de código.

• Modelado predictivo y minería de datos. SAS® Enterprise Miner™

optimiza el proceso de minería de datos para que usted pueda crear

rápidamente modelos predictivos y descriptivos afinados basados en

grandes volúmenes de datos. Un entorno de flujo de procesos

interactivo de documentación automática reduce el tiempo de

desarrollo de modelos para los mineros de datos y estadísticos.

Pueden usar métricas de evaluación y validación visuales, y comparar

múltiples modelos.

• Minería de textos. SAS Text Analytics ofrece una suite completa de

herramientas para descubrir y extraer conceptos y conocimientos de

las fuentes de texto, incluyendo la web, las notas de los call centers,

libros, etc. Puede añadir a sus modelos analíticos conocimientos de

fuentes basadas en texto para contar con más poder predictivo.

• Analítica en-memoria. El procesamiento analítico en-memoria

distribuido de SAS aprovecha una infraestructura analítica altamente

escalable y confiable, incluyendo dispositivos de bases de datos

como Pivotal Greenplum, Teradata, Oracle y SAP HANA, y hardware

estándar que utilice Hadoop. Dicho procesamiento veloz permite que

los modelos iterativos de machine-learning y estadísticos aprendan

muy rápidamente de fuentes de datos extremadamente grandes.

Implementación de Modelos Todo Desde Un Entorno de Fácil Uso SAS Enterprise Decision Manager es vital para mejorar la parte de implementación del ciclo de vida analítico. Ofrece un entorno compartido basado en la web para gestionar el ciclo de vida y el gobierno de sus activos de modelado, y es apto para los usuarios de negocio y TI. Los analistas seleccionan los datos y modelos de un repositorio centralizado, al tiempo de poder definir las reglas de negocio dentro del contexto de sus modelos. Este marco facilita seguir las actividades de modelado, hacer modificaciones y realizar continuamente pruebas en un solo entorno.

• Registro de modelos. Cuando se completa el desarrollo de mo-delos, los analistas registran un paquete de modelos que contiene el modelo, incluyendo todas las transformaciones de los datos, las imputaciones, etc., y todos sus resultados y documentación asociados. Este paquete asegura que se hayan dado los pasos correctos, y que un modelo adecuado y poderoso se libere en el entorno de producción. Asimismo, ayuda a las organizaciones a estandarizar el proceso de crear, gestionar, implementar y monitorear los modelos analíticos.

• Gobierno. El manejo de riesgos de los modelos incluye las métricas de responsabilidad y los reportes del estatus del control de versiones que registra quién cambió qué, cuándo se pasa el control de un área a otra, y más. Un repositorio de modelos centralizado, plantillas del ciclo de vida y el control de versiones brindan la visibilidad de los procesos analíticos y aseguran que puedan auditarse para cumplir con el gobierno interno y con las regulaciones externas.

• Repositorio de modelos. Un repositorio central seguro almacena la amplia documentación del modelo, su código de calificación y los metadatos asociados. Los modeladores pueden colaborar fácilmente y reutilizar el código de los modelos, mientras que sus actividades pueden seguirse a través de la autenticación de usuarios/grupos, del control de versiones y de los controles de auditoría.

• Calificación. Una vez que el modelo se ha revisado, aprobado y declarado listo para la producción, ha conseguido el estatus de campeón. Con sólo pulsar un botón, el flujo de trabajo completo de su modelo campeón puede convertirse en código de califica-ción que puede desplegarse en SAS, bases de datos de terceros, Hadoop y en servicios web.

Figura 4: Las técnicas de evaluación a la medida de SAS Factory Miner le permiten generar modelos campeones para cada segmento de sus datos.

9

• Procesos de calificación más veloces y mejor gobernados. Debido a que el modelo se califica directamente en la base de datos, el trabajo de ejecución de modelos aprovecha la escalabilidad y la velocidad de procesamiento que ofrece la base de datos. Los trabajos que solían tardar horas y días ahora pueden completarse en minutos y segundos. Se reduce el movimiento de los datos gracias a que la calificación analítica se realiza donde residen. Y ya que los datos no tienen que dejar el entorno de datos organizacionales altamente gobernados, el gobierno de datos está seguro. Incluso en entornos que son gestiona-dos más libremente como Hadoop, los beneficios de desempeño por la eliminación del movimiento y la eliminación de datos pueden ser importantes.

Gestión y Evaluación de Modelos: Un Proceso ConstanteUna vez que un modelo está en un entorno de producción y se está ejecutando para brindar respuestas, el modelo campeón se monitorea centralmente a través de una variedad de reportes basados en indicadores clave de rendimiento. Cuando el rendimiento del modelo comienza a degradarse por debajo del nivel de aceptación – de acuerdo con los activos de entrenamiento de modelos gestionados centralmente – el modelo puede volverse a calibrar rápidamente o ser remplazado con un nuevo modelo.

• Flujo de trabajo automático. Una consola de flujo de trabajo basada en la web permite que el proceso de gestión de modelos se vuelva más automática, repetible, colaborativa y gobernada. La organización (y los auditores) pueden seguir cada paso de un proyecto de modela-do, desde el planteamiento de un problema hasta el desarrollo, la implementación y el retiro.

• Gestión del ciclo de vida completo. Todas las etapas del ciclo de vida de un modelo se coordinan holísticamente, usando plantillas precons-truidas y definidas por los clientes, alineadas con los procesos de negocio de la organización.

• Monitoreo automático de modelos. Los trabajos de rendimiento de los modelos pueden programarse de manera recurrente – y los resul-tados se pueden monitorear constantemente – para un modelo o el inventario completo de modelos. Estos resultados pueden publicarse en los dashboards y umbrales definidos de desempeño. Y si estos umbrales son violados, los analistas reciben alertas de los modelos que necesitan atención, ahorrando así tiempo y dinero.

Con un marco formal de gestión de modelos, los mejores modelos entran a producción más rápidamente para comenzar a servir al negocio más pronto. La organización puede generar más y mejores modelos, con una gran variedad de métodos analíticos – con menos recursos. Los modelos analíticos son monitoreados y refinados continuamente, de modo que están actualizados y son precisos. El proceso completo de descubrimiento y de implementación se vuelve más transparente y mejor gobernado, por lo que es fácil explicar las decisiones basadas en la analítica a los reguladores y líderes de la empresa.

• Validación. La lógica de calificación se valida antes de que los mo-

delos se pongan en producción, usando una plantilla y un proceso

sistemático para registrar cada prueba por la que pasa el motor de

calificación, para asegurar que la lógica integrada en el modelo

campeón sea sólida.

¡Acción! Poniendo en Uso sus Resultados del Modelado Tan Rápido como Sea PosibleCon SAS, usted puede elegir entre múltiples opciones de implementación

para que sus modelos campeones se integren a sus sistemas de

producción, donde pueden producir conocimientos analíticos lo más

rápidamente posible. La implementación integrada y automática que

brindan los SAS Scoring Accelerators pueden aumentar el desempeño de

su implementación de modelos de varias formas.

• Implementación más veloz. Implemente procesos de información y

analíticos con una infraestructura y costos mínimos. La conversión del

código de calificación analítico completo a servicios web ligeros o

lenguajes nativos para el procesamiento en las bases de datos sucede

automáticamente. Esto elimina el proceso manual que consume

tiempo y es propenso a errores de traducir y validar el código de

calificación de modelos para diferentes entornos.

• Implementación flexible. Cuando se trata de varios sistemas operati-

vos, no hay una solución estándar. Sin que requieran cambios, los

mismos modelos pueden implementarse en sistemas en lote o en

tiempo real. Esto libera a los analistas del trabajo pesado de tener que

acomodar cada entorno con diferentes parámetros, código de

calificación y código inclusión a la medida.

Figura 5: SAS Decision Manager ayuda a acelerar el proceso de implementación de modelos. Integra la automatización del desarrollo de modelos con SAS Factory Miner y acelera las tareas manuales comunes, como la definición de reglas de negocio y la generación automática de vocabularios.

10

Los Magics no tienen una bola de cristal, pero tienen SAS Enterprise Miner, lo que les permitió entender mejor sus datos y desarrollar modelos analíticos que predicen las renovaciones de quienes tienen membresías para la temporada. Las herramientas de minería de datos permitió que el equipo lograra una calificación más precisa que marcó la diferencia – y el mejoró el mercado – en la manera en que se realizó la retención de clientes y la mercadotecnia.

Leer más

Más InformaciónPara consultar más información sobre la fase de descubrimiento del ciclo de vida analítico, lea La Minería de Datos de la A a la Z: Cómo Descubrir Conocimientos y Crear Mejores Oportunidades.

Para consultar más información sobre la fase de implementación, lea De los Datos a la Decisión: Cómo SAS Decision Manager Automatiza las Decisiones Operativas.

Casos PrácticosCon una visión del ciclo de vida analítico predictivo, el escenario posterior luce muy diferente al modo de operar – y crear una ventaja competitiva seria.

Institución Financiera del Reino Unido: Modernizando su Ciclo de Vida AnalíticoUna importante institución financiera del Reino Unido llegó a la conclusión de que su tiempo de ciclo de inicio de modelos hasta la implementación de éstos no cumplía con sus expectativas en el siglo XXI. El proceso era manual, propenso a errores y consumía muchos recursos – y contaba con un bajo o nulo monitoreo para identificar la degradación de los modelos.

Trabajando con SAS y el proveedor de almacenamiento de datos Teradata, la organización creó una plataforma de analítica predictiva flexible al integrar la gestión de datos, el desarrollo de modelos y la implementación de modelos usando la tecnología en-memoria. La plataforma aprovecha la escalabilidad del entorno de Teradata para la calificación de modelos y utiliza el poder de SAS Analytics para crear los modelos.

Con la nueva plataforma, pueden calificarse más de 55 millones de registros dentro de Teradata varias veces durante el día – algo que nunca podría haberse logrado con el proceso anterior. El tiempo necesario para promover un modelo a un entorno de producción se redujo de tres meses a días. El tiempo de preparación de los datos se redujo 40 por ciento. La productividad de los analistas aumentó 50 por ciento.

Orlando Magic: La Magia Detrás de la MagiaLos equipos deportivos profesionales en mercados más pequeños normalmente se esfuerzan por crear una base de ingresos lo suficientemente grande para competir contra sus rivales más grandes. Mediante el uso de SAS Analytics y SAS Data Management, el equipo de baloncesto Orlando Magic se encuentra entre los que más ingresos tienen dentro de la NBA, a pesar de estar en el vigésimo mercado más grande.

Los Magics realizan esta proeza al estudiar el mercado de reventa de boletos para establecer mejor los precios de los boletos, predecir quiénes son las personas que ya tienen boletos para la temporada y que están en riesgo de desertar (y atraerlos de vuelta), y analizar la concesión y las ventas de mercancía para asegurarse de que la organización tenga lo que sus fanáticos quieren siempre que entran al estadio. El club ha incluso utilizado a SAS para ayudar a los entrenadores a integrar la mejor alineación.

11

Qué Diferencia a SAS®• Preparación de datos para la analítica, exploración y

descubrimiento interactivos de datos, desarrollo de modelos modernos, implementación, monitoreo y gestión de modelos– todo en una plataforma integrada.

• Integración de múltiples disciplinas analíticas (como minería de datos, machine-learning, predicciones, analítica de texto y optimización) para una mayor agilidad del desarrollo de modelos y resolver problemas de negocio más complejos.

• Automatización inteligente y modelado predictivo a la medida y plantillas de machine-learning con las mejores prácticas integradas ofrecen herramientas de machine-learning para un conjunto diverso de usuarios.

• SAS puede gestionar un gran número de modelos complejos con variables virtualmente ilimitadas y volúmenes de datos extremadamente grandes.

• Un entorno de torneo de modelos automático y basado en la web aumenta la productividad al permitir que los modeladores prueben muchos enfoques simultáneamente de manera rápida y fácilmente usando algoritmos de machine-learning y estadísticos.

• Con capacidades de flujos de trabajo basados en la web, los usuarios pueden definir fácilmente procesos a la medida, gestionarlos hasta que se completen, fomentar la colaboración con notificaciones y establecer estándares empresariales.

• Un linaje de modelado desde la fuente de datos al resultado analítico ofrece gobierno esencial y crítico para cumplir con las regulaciones o los estrictos requisitos de reporteo.

• Los dashboards de monitoreo del rendimiento intuitivos y los gráficos ayudan a dar seguimiento al rendimiento de los modelos en múltiples proyectos para que los equipos puedan enfocarse en los proyectos que necesitan atenciónmás inmediata y evitar el deterioro de los modelos.

• La interoperabilidad con herramientas de modelado de terceros permite que las organizaciones importen, gestionen y monitoreen los recursos de modelado creados por SAS y otras herramientas (como, modelos PMML, R) todos juntos en un repositorio central.

• Las funciones de calificación en la base de datos pueden lograrse con bases de datos ampliamente utilizadas como Teradata, Aster Data, EMC Greenplum, IBM Netezza, IBM DB2, Oracle y Teradata.

• Los metadatos de SAS abarcan la gestión de datos y la analítica de modo que la transformación de los datos utilizada en la fase de descubrimiento pueda reutilizarse durante la implementación.

• SAS tiene amplia experiencia técnica y de negocio para soportar la preventa y posventa, lo que le ayuda a acelerar el tiempo para obtener valor y mejorar el retorno de la inversión.

Para contactar a SAS México, visite por favor: sas.com/mexico

SAS y el resto de los nombres de productos y servicios de SAS Institute Inc. son marcas registradas o marcas comerciales de SAS Institute Inc. en Estados Unidos y otros países. ® indica el registro en Estados Unidos. Otros nombres de marcas y productos son marcas registradas de sus respectivas compañías. Copyright© 2015, SAS Institute Inc. Todos los derechos reservados. 107169_S150641.0216