Download - Institucional PTF 2013
PMA
CÓMO APROVECHAR TODO EL POTENCIAL DE SUS BASES DE DATOS?
OCTUBRE 2013
…¿DÓNDE ESTÁ EL NEGOCIO?
Obtener la riqueza (transformar datos en información) de la Base de Datos sobre las transacciones de los clientes/usuarios de la empresa/organización/institución para aumentar el ROI al optimizar la relación con los mismos y promover y vender productos/servicios personalizados a las necesidades y deseos de cada uno; por
ende incrementamos las ventas al maximizar la fidelización!
Nombre: Alexis Bagurskas
Educación: Licenciado en Gerencia y Administración de Empresas –
Universidad ORT del Uruguay Licenciado en Comercio Internacional - UCUDAL
MBA – Database Marketing Master in Information Systems – Data Mining
Katz Graduate School of Business, University of Pittsburgh, PA.
Experiencia Laboral: Banca, Logística, Telecomunicaciones y Sistemas para
instituciones financieras.
Director fundador de DataLab Consulting y Hexalab.
Mod
ulo
1Mini Quiz
Nuevas tendencias?
Maximización de Base de Datos con Ejemplo del Salón del Vino
Mód
ulo
2DescriptivasBases de Datos y Sistemas de InformaciónEstrategia y Planeamiento de Comunicación Avanzada
Qué es Data Mining?
Mód
ulo
3Data Mining:
Técnicas, prácticas comunes, ejemplos distintos sectores
Minería de datos para Mktg 1 to 1 (sugerencias)
Mód
ulo
4Segmentación Basada en el Comportamiento Transaccional (histórico)
Ejemplos distintos sectores
Mód
ulo
5Modelos Predictivos.
Ejemplos: Propensión de Abandono y Credit Scoring
Mód
ulo
6Ejemplo Aplicación Tecnológica para Targeting, Monitoreo de Indicadores (KPIs) y Automatización de modelos de Data Mining
Conclusiones y Mini Quiz
PROGRAMA TENTATIVO:
Mod
ulo 1 Mini Quiz
Nuevas tendencias?
Maximización de Base de Datos con Ejemplo del Salón del Vino
QUE INFORMACIÓNCONOCEMOS
DE LOS PARTICIPANTES
DE ESTA CLASE?
file
Mód
ulo
2Descriptivas
Bases de Datos y Sistemas de InformaciónEstrategia y Planeamiento de Comunicación Avanzada
Qué es Data Mining?
INTRODUCCIÓN A BASES DE DATOS
SE CREA UN REGISTRO
EN LA BASE DE DATOS!
En cada operación (sucursal, web, etc.)…
En cada solicitud de crédito, compra de queso..…
En cada consulta…
En cada utilización de Tarjeta de Crédito…
En cada transacción de cajero automático…
LOS ‘DATOS’ ESTÁN DETRÁS DE CADA MOVIMIENTO:
NO ES POSIBLE OBTENER INFORMACIÓN DE LOS DATOS CRUDOS SIN APLICAR ANÁLISIS DE MINERÍA DE DATOS
BASES DE DATOS
> Evolución de los sistemas ha sido gradual:Diferentes áreas de negocio han ido implementando sus propios sistemas.
Notas:1. Cada aplicación tiene sus propios datos en sus propios archivos.2. Duplicación – varios sistemas mantienen mismos datos. 3. Incompatibilidad – sistemas no pueden compartir.
QUÉ ES UNA BASE DE DATOS?
MILESTONE: INDEPENDENCIA DE DATOS
> Mismos datos son utilizados por múltiples aplicaciones
> Son necesarias las herramientas para organizar, administrar y asegurar:
1. Datos centralizados2. Administrar los datos efectivamente3. Proveer acceso controlado a los datos compartidos
BASE DE DATOS
La Base de Datos es ahora el “sistema de información central” en todo proceso.
Una base de datos es una colección de datos:· orientada a un dominio· integrada· no volátil· variante en el tiempo
para ayudar en la toma de decisiones
[Immon 1992]
Actualmente,
· La tecnología OLAP generalmente se asocia a los almacenes de datos, aunque:
· Podemos tener Almacenes de Datos sin OLAP y viceversa.
Las Bases de Datos y las técnicas OLAP son las maneras más efectivas y tecnológicamente más avanzadas para integrar, transformar y combinar los datos para facilitar al usuario o
a otros sistemas el análisis de la información.
BASE DE DATOS
SQLServer DB2 ORACLE Informix Otras
JDBC
Ventas, Contabilidad, CRM, Call Center, etc.
SQLServer
DB2/NT
DB2/400
DB2/390
ORACLE Informix Sybase
Otras
Capa de Negocios
Capa de acceso a datos
INDEPENDENCIA MOTOR DE BASE DE DATOS
Datos
REQUERIMIENTOS DE BASE DE DATOS:> “Calidad” del modelo de datos
> “DATOS LIMPIOS” (criterios únicos, etc.)
> Seguir las reglas básicas de construcción:i. Todos los atributos, relaciones e identificadores deben estar
claramente definidos.ii. Nombres de las variables deben tener sentido y ser
significantes.iii. Completa, precisa, consistente, transportable, compartida y en
tiempo.iv. Todas las filas deben tener la misma cantidad de columnas y
estar completas.
REQUERIMIENTOS DE BASE DE DATOS:
> Problemas con Sistemas de Administración de Datos:
i. Redundanciaii. Falta de control de datosiii. Interfase pobreiv. Demoras en obtención de datosv. Sin rutina y frecuencia definida para actualizaciónvi. Falta de integración (diferentes BD, diferentes
formatos, etc.)vii. Falta de realidad
RECOLECCION DE DATOS
• Aparte de información interna de la organización, los almacenes de datos pueden recoger información externa:
• Demografías (censo), páginas amarillas, uso de Internet, redes sociales, información de otras organizaciones, etc.
• Datos compartidos en una industria o área de negocio, organizaciones y colegios profesionales, catálogos, etc.
• Datos resumidos de áreas geográficas, distribución de la competencia, evolución de la economía, información de calendarios y climatológicas, programaciones televisivas-deportivas,..
• Bases de datos externas compradas a otras compañías.
ADMINISTRACION DE DATOS:> Administración de datos es una disciplina en
constante evolución.> Los Responsables de la Administración de datos
tienen doble resposabilidad:1. Administrar los datos para estar al día en los
negocios.2. Administrar los datos para estar en los negocios
mañana.> Los Responsables de la Administración necesitan
ahora apoyar con tecnologías de inteligencia a la organización.
VENTAJAS DE UTILIZAR UN SISTEMA DE ADMINISTRACIÓN DE BASE DE DATOS
> Complejidad de la arquitectura de sistemas es reducida mediante la centralización de la administración de datos, su acceso, utilización, y seguridad.
> Redundancia es reducida o eliminada al poseer copias múltiples de los mismos datos.
> Calidad e integridad de los datos puede ser mejorada y provista a todas las aplicaciones.
ARQUITECTURA DE BASES DE DATOS
> Cliente-Servidor:
Clientes:• Usan SQL para preguntar a la base de
datos: - obtener, modificar, etc.
Network
Servidor Base de datos:• Almacena todos los datos• Atiende requerimientos SQL
Entrada de orden
Contabilidad
Producción
Bases de Datos en la Nube – Beneficios:
> Inversión inicial en infraestructura casi nula> Infraestructura justo a tiempo> Utilización de recursos más eficiente> Costes según el uso> Reducción del tiempo de comercialización> Automatización> Auto scaling> Ciclo de vida del desarrollo más eficiente> Funciones de prueba mejoradas> Recuperación de desastres y continuidad empresarial
ENTIDADES Y TABLAS
PASOS PARA CONSTRUIR UNA BASE DE DATOS
> Diseño preparatorio – pensar sobre:
¿Qué tablas necesitaré para almacenar datos?• Entidades de negocios primarias
¿Qué queries o vistas de datos necesitaré?• Diferentes perspectivas de las entidades primarias
¿Qué reportes serán requeridos por Dirección, Gerentes, Ejecutivos de Cuenta, etc.?
¿Qué interfases son necesarias para mantener los datos?
> Documentar éstas ideas!!!!
> Crear las piezas: Tablas (primero) Queries Formularios Reportes
> IMPORTANTE: No es usualmente muy difícil cambiar estructura, si estamos temprano en el proceso de crear una Base de Datos
PASOS PARA CONSTRUIR UNA BASE DE DATOS
MODELADO DE DATOS
> Existen técnicas para identificar y documentar la estructura lógica de datos
> Tema independiente del sistema de administración de Base de Datos que la empresa posea
> Basado en principios de bases de datos relacionales
> Notación genérica
TERMINOLOGÍA
> Campo – un dato o atributo como ser nombre o fecha de nacimiento
> Registro – describe una instancia de una entidad como una persona o una orden
> Clave – un campo que identifica un registro de manera única
> Archivo – grupo de registros
MODELADO DE DATOS:ENTIDADES Y ATRIBUTOS
> Entidad: rectángulo Nombrada con un sustantivo singular
> Atributos: listados o variables en la entidad Características
> Identificador: un atributo etiquetado con * Unica etiqueta
Diagramas de Relacionamiento entre entidades
> Gráficamente ilustra las entidades (tablas) en la base de datos y el relacionamiento entre ellas:
Empleado
Dependientes Seguro
Es responsable porEs cubierto para
> La relación entre EMPLEADO a DEPENDIENTE es caracterizada por dos símbolos:· la “pata de gallina" al final de la línea que va desde EMPLEADO a
DEPENDIENTE indica que un empleado puede tener mas de un dependiente.
· El círculo indica que es opcional, por ejemplo: un empleado puede no tener dependientes.
Empleado
Dependiente Seguro
Es responsable porEs cubierto para
Diagramas de Relacionamiento entre entidades
> La relación de DEPENDIENTE a EMPLEADO es caracterizada por dos símobolos:· La línea vertical bajo EMPLEADO que conecta con DEPENDIENTE indica que un
dependiente es la responsabilidad de sólo 1 empleado.
La pequeña línea tipo guión debajo de EMPLEADO indica que un dependiente DEBE tener un empleado responsable por él/ella – por ejemplo: No habrá ni uno en la tabla DEPENDIENTE que no sea un dependiente de un empleado.
Empleado
Dependientes Seguro
Es responsable porEs cubierto para
Diagramas de Relacionamiento entre entidades
> La relación entre EMPLEADO a SEGURO está caracterizada por dos símbolos:· La línea vertical sobre SEGURO se conecta con EMPLEADO indica que un
empleado puede seleccionar sólo un único plan de seguro.· La línea horizontal en SEGURO indica que un empleado debe seleccionar un plan
de seguro.
Empleado
Dependientes Seguro
Es responsable porEs cubierto para
Diagramas de Relacionamiento entre entidades
> La relación de SEGURO a EMPLEADO está caracterizada por dos símbolos:· La pata de gallina bajo EMPLEADO que conecta con SEGURO indica que
un plan de seguro puede ser seleccionado por mas de un empleados.
El círculo debajo de éste indica que podría haber un plan de seguro el cuál no está seleccionado por ningún empleado.
Empleado
Dependientes Seguro
Es responsable porEs cubierto para
Diagramas de Relacionamiento entre entidades
SQL - Structured Query Language:
> Select – obtener datos> Insert – agregar datos> Update – alterar o modificar datos> Delete – borrar o eliminar datos
FASES: SELECCIÓN, LIMPIEZA Y TRANSFORMACIÓN DE DATOS
LIMPIEZA (DATA CLEANSING) Y SELECCIÓN DE DATOS:
Se deben eliminar el mayor número posible de datos erróneos o inconsistentes e irrelevantes.
Métodos estadísticos casi exclusivamente.• histogramas (detección de datos anómalos)• selección de datos (muestreo, ya sea verticalmente,
eliminando atributos, u horizontalmente, eliminando registros).
• redefinición de atributos (agrupación o separación).
Acciones ante datos anómalos (outliers):
• ignorar: algunos algoritmos son robustos a datos anómalos (p.ej.: Árboles de decisión)
• filtrar (eliminar o reemplazar) la columna: solución extrema, pero a veces existe otra columna dependiente con datos de mejor calidad.
• filtrar la fila: puede sesgar los datos, porque muchas veces las causas de un dato erróneo están relacionadas con casos o tipos especiales.
FASES: SELECCIÓN, LIMPIEZA Y TRANSFORMACIÓN DE DATOS
CONT……FASES: SELECCIÓN, LIMPIEZA Y TRANSFORMACIÓN DE DATOS
• reemplazar el valor: por el valor ‘nulo’ si el algoritmo lo trata bien o por máximos o mínimos, dependiendo por donde es el outlier, o por medias.
• discretizar: transformar un valor continuo en uno discreto (p.ej. muy alto, alto, medio, bajo, muy bajo) hace que los outliers caigan en ‘muy alto’ o ‘muy bajo’ sin mayores problemas.
FASES: SELECCIÓN, LIMPIEZA Y TRANSFORMACIÓN DE DATOS
Acciones ante datos faltantes (missing values):
• ignorar: algunos algoritmos son robustos a datos faltantes.• filtrar (eliminar o reemplazar) la columna: solución extrema,
pero a veces existe otra columna dependiente con datos de mejor calidad. Preferible a eliminar la columna es reemplazarla por una columna diciendo si el valor existía o no.
• filtrar la fila: claramente sesga los datos, porque muchas veces las causas de un dato faltante están relacionadas con casos o tipos especiales.
CONT……FASES: SELECCIÓN, LIMPIEZA Y TRANSFORMACIÓN DE DATOS
• reemplazar el valor: por medias. A veces se puede predecir a partir de otros datos.
• modificar la política de calidad de datos y esperar hasta que los datos faltantes estén disponibles.
FASES: SELECCIÓN, LIMPIEZA Y TRANSFORMACIÓN DE DATOS
Razones sobre datos faltantes (missing values):
A veces es importante examinar las razones tras datos faltantes y actuar en consecuencia:
• algunos valores faltantes expresan características relevantes: p.ej. la falta de teléfono puede representar en muchos casos un deseo de que no se moleste a la persona en cuestión, o un cambio de domicilio reciente.
• valores no existentes: muchos valores faltantes existen en la realidad, pero otros no. Por ej.: el cliente que se acaba de dar de alta no tiene consumo medio de los últimos 12 meses.
SISTEMAS DE INFORMACIÓN:
La información reduce nuestra incertidumbre (sobre algún aspecto de la realidad) y, por tanto, nos
permite tomar mejores decisiones
· Inicialmente la finalidad de los sistemas de información era recopilar información para ayudar limitadamente en la toma de decisiones:· recuentos de cereales· censos civiles y militares romanos o chinos,
· Actualmente, con la informatización de las organizaciones y la aparición de aplicaciones software operacionales sobre el sistema de información, la finalidad principal de los sistemas de información es dar soporte a los procesos básicos de la organización (ventas, producción, personal...).
FINALIDAD DE LOS SISTEMAS DE INFORMACIÓN:
CONT…..:
Una vez satisfecha la necesidad de tener un soporte informático para los procesos básicos de la organización
(sistemas de información para la gestión).
Las organizaciones exigen nuevas prestaciones de los sistemas de información
(sistemas de información para la toma de decisiones).
EVOLUCIÓN:· 60’s: Informes batch:
· la información es difícil de encontrar y analizar, poco flexible, se necesita reprogramar cada solicitud.
· 70’s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems):
· No integrados con el resto de herramientas.
· 80’s: Acceso a datos y herramientas de análisis integradas (conocidas como BI tools (Business Intelligence Tools; en español: Herramienta de Inteligencia de Negocios):
· Herramientas de consultas e informes, hojas de cálculo, interfaces gráficos e integrados, fáciles de usar.
· Acceden a las bases de datos operacionales.
· 90’s: Almacenes de Datos y herramientas OLAP.
· 00’s: Herramientas de Minería de Datos y Simulación.
HERRAMIENTAS PARA LA TOMA DE DECISIONES:
· ¿Cuál es la diferencia entre EIS y OLAP?
· ¿Cuál es la diferencia entre “informes avanzados” y OLAP?
· ¿Cuál es la diferencia entre OLAP y Minería de Datos?
· ¿Qué interrelaciones existen entre todas estas herramientas?
Han aparecido diferentes herramientas de Negocio o de Soporte en la Decisión (DSS) que coexisten: EIS, OLAP, consultas e informes, minería de datos, ...
HERRAMIENTAS PARA LA TOMA DE DECISIONES:
· Un EIS (Executive Information System) es un sistema de información y un conjunto de herramientas asociadas:
· Proporciona a los directivos de la organización acceso a la información de estado y sus actividades de gestión.
· Está especializado en analizar el estado diario de la organización (mediante indicadores clave) para informar rápidamente sobre cambios a los directivos.
· La información solicitada suele ser, en gran medida, numérica (ventas semanales, nivel de stocks, balances parciales, etc.) y representada de forma gráfica al estilo de las hojas de cálculo.
· Las herramientas OLAP (On-Line Analyitical Processing) son más genéricas:· Funcionan sobre un sistema de información (transaccional o almacén de datos)· Permiten realizar agregaciones y combinaciones de los datos de maneras
mucho más complejas y ambiciosas, con objetivos de análisis más estratégicos.
¿CUÁL ES LA DIFERENCIA ENTRE EIS Y OLAP?
VER EJEMPLO CUBOS
· Las herramientas OLAP · proporcionan facilidades para “manejar” y “transformar” los datos.· producen otros “datos” (más agregados, combinados).· ayudan a analizar los datos porque producen diferentes vistas de los
mismos.
· Las herramientas de Minería de Datos:· son muy variadas: permiten “extraer” patrones, modelos, descubrir
relaciones ocultas, regularidades, tendencias, etc.· producen “reglas” o “patrones” (“conocimiento”).
¿CUÁL ES LA DIFERENCIA ENTRE OLAP Y MINERÍA DE DATOS?
HERRAMIENTAS PARA LA TOMA DE DECISIONES:
¿QUÉ INTERRELACIONES EXISTEN ENTRE TODAS ESTAS HERRAMIENTAS?
Base de Datos Transaccional
Fuentes Internas
Fuentes Externas
Fuente de Datos
Fuente de Datos 3
HTML
Fuente de Datos 1
texto
Almacén de Datos
ETL Interfaz y Operadores
Herramientas de consultas e
informes
Herramientas EIS
Herramientas OLAP
Herramientas de Minería de
Datos
HERRAMIENTAS PARA LA TOMA DE DECISIONES:
Tipos de Sistemas de informaciónPropósito del sistema
Transaction processingsystemTPS
Recolecta y almacena datos de transacciones de rutina.
Management informationsystemMIS
Convierte datos de un TPS en información paraplaneamiento, control, y dirección de una organización.
Decision support systemDSS
Apoya a las decisiones de Gerencia al proveermodelos de procesamiento y análisis de datos.
Executive information systemEIS
Provee a los Directores y Gerencias de informaciónnecesaria para monitorear la performance de laorganización y desarrolla e implementa estrategias.
On-line analytical processing(OLAP)
Presenta de manera multidimensional, la vista lógica dedatos al analista con no requisitos de saber cómo los datos
son almacenados.Data mining Utiliza análisis estadísticos y técnicas de inteligencia
artificial para identificar relaciones ocultas en los datos.
TIPOS DE SISTEMAS DE INFORMACIÓN:
PIRÁMIDE DE INFORMACIÓN:
DataWarehouse
Cierres y Análisis de Consistencia (DataCleansing)
Reportes Específicos
Análisis Multidimensional
Base de Datos InstitucionalFuentes Externas
Otras Fuentes (Excel, etc.)
BI, Scorecard
Data Mining
> Su organización aprende de la experiencia recolectada.
> La mayoría de las empresas son muy ricas en datos pero muy pobres en información.
> Debemos convertir a las mismas en ricas en información!
> DataWarehouse es la memoria de la institución.
> Data Mining su inteligencia.
DATOS # INFORMACION:
Cuál es la ruta (estrategia) para convertir una organización que basa sus decisiones en datos (no conocimiento), intuición, política y otros factores a una organización que basa sus decisiones en conocimiento e información?
Y cómo hacerlo de manera exitosa?
ROAD MAP:
CLAVES PARA IMPLEMENTACION DE ESTRATEGIA:
•Ejemplos:•Mantener liderazgo•Aumentar las ventas y/o•Crecer en cartera de Clientes, cuentas, otros…….
•Aumentar el Retorno sobre la Inversión (ROI)
Premisas:
•Liderazgo ejecutivo•Transmitir eficientemente la Estrategia: mapa•Alinear la organización: Unidades de Negocio, Soporte y Dirección•Motivar a empleados: entrenamiento, educación, otros•Integrar la estrategia al planeamiento y presupuesto
Definición de
Estrategia:
•Actividades de distintas Unidades de Negocio, Soporte, DirecciónEjemplo: nuevo canal de ventas. Ventajas?
•Imperativo: nivel corporativo con “Rol Activo” en identificar y coordinar oportunidades
Sinergía y Alineación:
PREMISAS
VENTAS
COSTOS
Cómo?: Aumentando ingresos y/o reduciendo gastos.
Ajustando servicios y/o productos, Monitoreando clientes riesgosos, Elaborando mensajes al cliente, Creando y lanzando “campañas” a segmentos/targets, Identificando y reteniendo a los clientes más rentables, Identificando y atrayendo nuevos clientes, Liberando a los clientes no rentables, Evadiendo potenciales clientes de alto riesgo, Atrayendo nuevamente a clientes perdidos, Anticipándose con ofrecimiento de nuevos servicios/productos.
AUMENTAR EL ROI:
Aumentar el ROI, satisfaciendo al cliente:
RECORDANDO QUE EL MARKETING YA NOES LO QUE ERA…
> Vendíamos a segmentos socio-demográficos
> Campañas masivas> Productos “genéricos”> Comunicación masiva> Precios: por producto> Indicador: market share> Costos: según plan de cuentas> Rentabilidad por producto
> Objetivo: vender productos
> Manejamos relaciones individuales> Contactos individualizados> Propuestas individualizadas> Canales individualizados> Precios: por cliente> Indicador clave: LTV lifetime value> Costos: costeo por cliente> Rentabilidad individual
> Objetivo: realizar el valor potencial de cada relación
Herramientas de análisis habituales:• Investigación• Planificación de medios• Análisis de segmentación tradicional• Mediciones de impacto• Otros
Herramientas de análisis habituales:• Predicción• Clasificación• Segmentación en base al comportamiento• Cross Selling• Propensión de abandono
Herramientas de análisis agregado Herramientas de análisis individual
Y QUE LAS RELACIONES PUEDEN SER MANEJADAS…..Las relaciones ocurren independientemente de que hagamos algo al respecto.Sin embargo, podemos aumentar nuestros resultados al manejarlas activamente
Reducción de costos de adquisición
Rentabilización por profundización e individualización
de precios.
Predicción de abandono y
retención
Abandono normalmenteindetectado
Rentabilidad pormenores costosde transacción
Tiempo
Ingresos
Ciclo de vida “espontáneo” del cliente”
Ciclo de vida manejado por la empresa
Las Tres Dimensiones de la RelaciónSobre estas tres dimensiones es posible trabajar a nivel individual
Duración (en el tiempo)
Profundidad(cantidad de cada prod.)
Alcance(cantidad deproductos)
Existe una relación positiva entre estas tres dimensiones
RetenciónVenta Cruzada
Venta en Profundidad
ESTRATEGIA
Cómo definimos la “estrategia”?Qué lineamiento deberíamos seguir?
Se definen sobre la base de:1. Aumentar el ROI2. Crear mayor valor a la Empresa
Cómo?:Conociendo al Cliente
Con qué herramienta?:Marco de trabajo de 4 perspectivas
4 Perspectivas para Crear Valor a la Empresa:
Crear Valor a la empresa
Financiera
Procesos Internos
Aprendizaje y
Crecimiento
Cliente
• Cuáles son las expectativas de la Performance Financiera?• Cómo incrementamos el valor de nuestras unidades de negocio?
Financiera
• Para alcanzar los objetivos financieros, cómo creamos valor a nuestros clientes?• Cómo incrementamos el valor total de nuestros clientes?
Cliente
• Qué procesos debemos implementar para satisfacer nuestros clientes?• Cómo podemos lograr economías de escala?
Procesos Internos
• Cómo alineamos nuestros activos intangibles (empleados, sistemas, cultura) para mejorar nuestros procesos críticos?
• Y cómo los desarrollamos y compartimos?
Aprendizaje y Crecimiento
4 Perspectivas para Crear Valor a la empresa:
LA SEQUENCIA DEL TRANSMISION DE ESTRATEGIA:
1. Generación de la
Estrategia de la empresa
Directorio 2
Mapa estratégico de la empresa
Mapa estratégico de la empresa
3
Mapa estratégico de la empresa
Mapa estratégico Funcional
Actualización de Estrategia
Funcional
HR
FINANZASIT
4 Mapa estratégico de las UN
Mapa estratégico de la empresa
Actualización de la
Estrategia de las Unidades de Negocio
Clientes 6
5
Mapa estratégico de las UN
Servicios de Unidades de
Soporte
Actualización Unidades de
Soporte
HR
FINANZASIT
7Proveedores
AlianzasUnidades de Soporte
8Mapa
funcionalde las UN
Mapa estratégico Funcional
Unidades de Soporte Corporativo
SINERGIAY
ALINEACION
ALINEACION Y SINCRONIZACION:
CÓMO MAXIMIZAR EL RELACIONAMIENTO CON EL CLIENTE Y AUMENTAR EL VALOR TOTAL DEL MISMO?
EJEMPLO:
1. Estrategia de única fuerza de venta
2. Educar y enterar a los clientes un amplio rango de productos/servicios y asesoría para cubrir sus necesidades
3. Creó una red de especialistas para instruir a la fuerza de ventas para atender a clientes y realizar venta cruzada sobre el amplio portfolio de productos/servicios
4. El cliente ahora conoce al equipo de venta y las distintas oportunidades para lograr una solución completa en un solo lugar
Cómo Profundizamos en el Conocimiento de Cada Cliente?
Con Minería de Datos
PROBLEMAS QUE ENFRENTAN LAS EMPRESAS:
Sólo el 40% de los clientes son rentables.
El 10% más rentable, genera el 230% de las utilidades, pero no los conocemos.
Los clientes no rentables en su conjunto destruyen el 65% del resultado.
En un alto porcentaje de los casos, los clientes abandonan la institución sin haber compensado sus costos de captación.
Los precios de los productos son fijados independientemente del costo de los clientes y su riesgo.
Las acciones de marketing son de difícil medición en sus resultados.
La inmensa mayor parte de las relaciones existentes están sub-explotadas.
FUENTE: American Bankers Association
COMPORTAMIENTOTransacciones
Historia transaccional y tendencias de utilización de los servicios
Participación en promociones
MI CLIENTE
DESCRIPTIVOSCaracterísticas
Socio y geo demográficos
ACTITUDINALESOpiniones
PreferenciasNecesidades
Deseos
KYC – CONOZCA SU CLIENTE
ROI
IDENTIFICACION UNICA DE CLIENTE O
TARJETA DE LEALTAD
1 a 1
1. Aumentando ventas o
2. Reduciendo costos
Diseñando propuestas específicas a sus clientes y lanzando campañas de Ventas Cruzadas efectivas.
• Identificar al cliente• Administrar sus cuentas• Entender y conocer su
frecuencia, recencia y valor vitalicio
KYC
ROI
IDENTIFICADOR UNICO DE CLIENTE
1 TO 1
VENTA CRUZADA
MBA
SEGMENTACION
PROP. DE ABANDONO
ADM. CAMPAÑAS
KYC
ROI
IDENTIFICADOR UNICO DE CLIENTE
1 TO 1
VENTA CRUZADA
MBA
SEGMENTACION
PROP. DE ABANDONO
ADM. CAMPAÑAS
AUTOMATIZACIONY MEDICION
Herramienta Tecnológica
¿QUÉ ES MINERIA DE DATOS?
• Es la exploración y análisis de grandes cantidades de datos con el objetivo de descubrir patrones significativos de comportamiento de clientes que están ocultos.
• Cada interacción con el cliente es una oportunidad de aprendizaje. Lo importante es que sea registrado y contar con las herramientas para analizarlo.
Data Warehouse es la memoria de la institución.
Data Mining, su inteligencia.
QUÉ ES MINERIA DE DATOS?:
Término reciente para la confluencia de ideas desde estadísticas y ciencias de la computación (métodos de bases de datos y aprendizaje propio de las computadoras) aplicadas a grandes bases de datos en ciencias, ingeniería y negocios. *
* First International workshop on Knowledge Discovery and Data Mining was in 1995
QUÉ ES MINERIA DE DATOS?:
La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten:
· Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos.
· Extraer patrones y tendencias para predecir comportamientos futuros.
Debido al gran volumen de datos este análisis ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser semi-automático.
QUÉ ES MINERIA DE DATOS?:
Gartner Group:
“Data mining es el proceso de descubrir nuevas correlaciones significantes, patrones y tendencias escrutinando a través de grandes cantidades de datos almacenados en repositorios, utilizando tecnologías de reconocimiento de patrones como también técnicas de estadísticas y matemáticas.”
QUÉ ES MINERIA DE DATOS?:
Mi favorita:
“Statistics at scale and speed”Darryl Pregibon
“Estadísticas a escala y velocidad”
EJEMPLO DE MINERÍA DE DATOS…
EJEMPLO BÁSICO UTILIZANDO MINERÍA DE DATOS:
> Datos: 20 marcas/tipos de cerveza.
> Variables objetivas y subjetivas.
> Objetivo: las variables objetivas sirven para realizar una segmentación?
> Interesante conocer si los segmentos son apoyados por las variables subjetivas.
> Paso 1: ver los datos.
> Paso 2: selecciono las variables objetivas y corro estadística descriptiva.
> Paso 3: analizo los datos y las diferencias entre ellos.
> Paso 4: específico al caso, dadas las diferencias se deberá standarizar los datos.
EJEMPLO BÁSICO UTILIZANDO MINERÍA DE DATOS:
> Paso 5: Preparar para correr el modelo jerárquico.
> Paso 6: Selecciono las variables
> Paso 7: Por defecto seleccionar Estadística y Plots/Gráfica
> Paso 8: En “Método”, seleccionar estandarizar Z scores porque …….
EJEMPLO BÁSICO UTILIZANDO MINERÍA DE DATOS:
Mód
ulo
3 Data Mining:
Minería de datos para Mktg 1 to 1 (sugerencias)
Técnicas, prácticas comunes, ejemplos distintos sectores
LA TENDENCIA MUNDIAL…
FUENTE:Aberdeen Group: mas de 200 organizaciones entrevistadas para determinar la proyección de Customer Analytics.
LA TENDENCIA MUNDIAL…
LA TENDENCIA MUNDIAL…
LA TENDENCIA MUNDIAL…
Cómo será el Marketing en próximos años?
Estrategia deMarketing
Branding ComunicaciónComercial
Publicidad RRPP Referenciación
Manejo de Relaciones
Data Mining BusinessRules
MediosEspecializados
MKTG 1 to 1 Motor de sugerencias
con Data Mining
ES LA IDENTIFICACIÓN DE PREFERENCIAS DE COMPRA
PARA CADA TIPO DE PRODUCTOS O SERVICIOS.
¿QUÉ ES SBC 1to1?
SBC 1to1 PERMITE:
Cross & Up Selling
Fidelizar Cartera
Reducción de inversión en promociones
INCREMENTO DE VENTAS!
Constituye el escalón más avanzado en KYC : conocimiento 1to1.
¿QUÉ PRODUCTOS O SERVICIOS A QUÉ CLIENTE?
BASE DE DATOS
CARACTERIZACIÓN DEL CLIENTE: PRODUCTOS, TRANSACCIONES, CANALES.
¿QUÉ PRODUCTOS A QUÉ CLIENTE?
“Top picks for you”Sugerencias basadas en preferencias de usuarios según su perfil de visitas (búsquedas, artículos vendidos y compras conjuntamente).
Se identifica qué beneficios serán de interés para el usuario en base a sus transacciones históricas.
S-Box: Motor de Sugerencias 1to1
Cross Selling
Sugerencias basadas en preferencias de usuarios ‘similares’ en cuanto al perfil de búsquedas y compras.
Upgrade
Sugerencias de artículos relacionados a artículos con mayor margen de ganancia.
AUMENTAR LAS VENTAS…
Incrementando la tasa de respuesta a artículos
recomendados.
Generando nuevas oportunidades de venta en
cada visita del usuario.
Incrementando las visitas a través de la
comunicación personalizada.
Objetivo
Ejemplo de alcance:
Grilla de categorías y productos disponiblesTarjeta N° 123.456
Tabaco Habanos Habanos Cubanos
Cigarrillos europeos
Cigarrillos american.
Cigarrillos regionales Bestsellers Accesorios
Cigarros -
Bebidas Whisky Escocés
Whisky +12 años Aperitivos Vinos $$$ Vinos $
Bebidas blancas $$
$Bebidas
blancas $Otros y Champ.
Equipaje Bolsos y de mano Backpacks Laptop
covers Set Valijas Accesorios - - -
Cosméticos Cuidado Piel $$$
Cuidado Piel $
Maquillaje $$$
Maquillaje $
Bath & Body
Anti arrugas
Filtros solares $$$
Filtros solares $
Perfumería Fem.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Perfumería Masc.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Juguetería Muñecos de acción
Art & Crafts $$$
Art & Crafts $ Baby toys Top rated Novedad-
esPuzzle,
Lego, etc -
Tabaco Habanos Habanos Cubanos
Cigarrillos europeos
Cigarrillos american.
Cigarrillos regionales Bestsellers Accesorios
Cigarros -
Bebidas Whisky Escocés
Whisky +12 años Aperitivos Vinos $$$ Vinos $
Bebidas blancas $$
$Bebidas
blancas $Otros y Champ.
Equipaje Bolsos y de mano Backpacks Laptop
covers Set Valijas Accesorios - - -
Cosméticos Cuidado Piel $$$
Cuidado Piel $
Maquillaje $$$
Maquillaje $
Bath & Body
Anti arrugas
Filtros solares $$$
Filtros solares $
Perfumería Fem.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Perfumería Masc.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Juguetería Muñecos de acción
Art & Crafts $$$
Art & Crafts $ Baby toys Top rated Novedad-
esPuzzle,
Lego, etc -
S-Box: Motor de Sugerencias 1to1
Tabaco Habanos Habanos Cubanos
Cigarrillos europeos
Cigarrillos american.
Cigarrillos regionales Bestsellers Accesorios
Cigarros -
Bebidas Whisky Escocés
Whisky +12 años Aperitivos Vinos $$$ Vinos $
Bebidas blancas $$
$Bebidas
blancas $Otros y Champ.
Equipaje Bolsos y de mano Backpacks Laptop
covers Set Valijas Accesorios - - -
Cosméticos Cuidado Piel $$$
Cuidado Piel $
Maquillaje $$$
Maquillaje $
Bath & Body
Anti arrugas
Filtros solares $$$
Filtros solares $
Perfumería Fem.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Perfumería Masc.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Juguetería Muñecos de acción
Art & Crafts $$$
Art & Crafts $ Baby toys Top rated Novedad-
esPuzzle,
Lego, etc -
2. Identifico oportunidades Cross Selling para cada usuario
Tarjeta N° 123.456
Tabaco Habanos Habanos Cubanos
Cigarrillos europeos
Cigarrillos american.
Cigarrillos regionales Bestsellers Accesorios
Cigarros -
Bebidas Whisky Escocés
Whisky +12 años Aperitivos Vinos $$$ Vinos $
Bebidas blancas $$
$Bebidas
blancas $Otros y Champ.
Equipaje Bolsos y de mano Backpacks Laptop
covers Set Valijas Accesorios - - -
Cosméticos Cuidado Piel $$$
Cuidado Piel $
Maquillaje $$$
Maquillaje $
Bath & Body
Anti arrugas
Filtros solares $$$
Filtros solares $
Perfumería Fem.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Perfumería Masc.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Juguetería Muñecos de acción
Art & Crafts $$$
Art & Crafts $ Baby toys Top rated Novedad-
esPuzzle,
Lego, etc -
3. Identifico oportunidades de Up Selling para cada usuario
Tabaco Habanos Habanos Cubanos
Cigarrillos europeos
Cigarrillos american.
Cigarrillos regionales Bestsellers Accesorios
Cigarros -
Bebidas Whisky Escocés
Whisky +12 años Aperitivos Vinos $$$ Vinos $
Bebidas blancas $$
$Bebidas
blancas $Otros y Champ.
Equipaje Bolsos y de mano Backpacks Laptop
covers Set Valijas Accesorios - - -
Cosméticos Cuidado Piel $$$
Cuidado Piel $
Maquillaje $$$
Maquillaje $
Bath & Body
Anti arrugas
Filtros solares $$$
Filtros solares $
Perfumería Fem.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Perfumería Masc.
Mas vendidos $
$$Mas
vendidos $ Tamaño G Tamaño Ch Top rated Indiferen-te - -
Juguetería Muñecos de acción
Art & Crafts $$$
Art & Crafts $ Baby toys Top rated Novedad-
esPuzzle,
Lego, etc -
S-Box: Motor de Sugerencias 1to1
Rubro Categoría
CC Moneda Nacional No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
# Trans. Web
Nivel 1
# Trans. Web
Nivel 2
# Trans. ATM
Nivel 1
# Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
CC Moneda Extranjera No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
#Trans. Web
Nivel 1
#Trans. Web
Nivel 2
#Trans. ATM
Nivel 1
#Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
Plazo fijo M. Ext. No Tiene Capital Nivel 1
Capital Nivel 2
Capital Nivel 3
Plazo: 3m
Plazo: 6m
Plazo: 12m
Solicita Web
Solicita Sucursal …
Préstamo Hipotecario No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 120
cuotas
Plazo: 120 - 180
cuotas
Plazo: 180 y + cuotas
Solicita Web
Solicita Sucursal …
Préstamo Automotor No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 12 cuotas
Plazo: 12 - 18 cuotas
Plazo: 18 y + cuotas
Solicita Web
Solicita Sucursal …
Sobregiros No TieneSobregiro AVG Nivel 1
Sobregiro AVG Nivel 2
Meses c/ OVD
<3/12
Meses c/ OVD 3-6/12
Meses c/OVD 6-12/12
Días AVG OVD <15
Días AVG OVD 16 -30
Días AVG OVD 31-60
…
Otros………….. … … … … … … … … … …
¿QUÉ PRODUCTOS A QUÉ CLIENTE?EJEMPLO SECTOR FINANCIERO
Rubro N° Cliente: 123456 Categoría
CC Moneda Nacional No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
# Trans. Web
Nivel 1
# Trans. Web
Nivel 2
# Trans. ATM
Nivel 1
# Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
CC Moneda Extranjera No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
#Trans. Web
Nivel 1
#Trans. Web
Nivel 2
#Trans. ATM
Nivel 1
#Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
Plazo fijo M. Ext. No Tiene Capital Nivel 1
Capital Nivel 2
Capital Nivel 3
Plazo: 3m
Plazo: 6m
Plazo: 12m
Solicita Web
Solicita Sucursal …
Préstamo Hipotecario No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 120
cuotas
Plazo: 120 - 180
cuotas
Plazo: 180 y + cuotas
Solicita Web
Solicita Sucursal …
Préstamo Automotor No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 12 cuotas
Plazo: 12 - 18 cuotas
Plazo: 18 y + cuotas
Solicita Web
Solicita Sucursal …
Sobregiros No TieneSobregiro AVG Nivel 1
Sobregiro AVG Nivel 2
Meses c/ OVD
<3/12
Meses c/ OVD 3-6/12
Meses c/OVD 6-12/12
Días AVG OVD <15
Días AVG OVD 16 -30
Días AVG OVD 31-60
…
… … … … … … … … … … …
¿QUÉ PRODUCTOS A QUÉ CLIENTE?
+Cuenta Corriente U$S: Promedio Balance Anual U$S 36.000; 10 transacciones
mensuales, 35% Sucursal, 55% Web y 5% Otras (móvil, etc.).
Crédito Hipotecario: U$S 110K; Máximo atraso= 10 días; Forma de pago: débito.
Sobregiros: Promedio U$S 500; máximo atraso 20 días.
Productos NO CONTRATADOS:
Cuenta de Ahorro, Préstamos Automotores, Tarjeta de Crédito.
Cliente N° 123456 García, Ramón.
Fecha alta: 12/01/2005
¿QUÉ PRODUCTOS A QUÉ CLIENTE?
Rubro N° Cliente: 123456 Categoría
CC Moneda Nacional No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
# Trans. Web
Nivel 1
# Trans. Web
Nivel 2
# Trans. ATM
Nivel 1
# Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
CC Moneda Extranjera No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
#Trans. Web
Nivel 1
#Trans. Web
Nivel 2
#Trans. ATM
Nivel 1
#Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
Plazo fijo M. Ext. No Tiene Capital Nivel 1
Capital Nivel 2
Capital Nivel 3
Plazo: 3m
Plazo: 6m
Plazo: 12m
Solicita Web
Solicita Sucursal …
Préstamo Hipotecario No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 120
cuotas
Plazo: 120 - 180
cuotas
Plazo: 180 y + cuotas
Solicita Web
Solicita Sucursal …
Préstamo Automotor No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 12 cuotas
Plazo: 12 - 18 cuotas
Plazo: 18 y + cuotas
Solicita Web
Solicita Sucursal …
Sobregiros No TieneSobregiro AVG Nivel 1
Sobregiro AVG Nivel 2
Meses c/ OVD
<3/12
Meses c/ OVD 3-6/12
Meses c/OVD 6-12/12
Días AVG OVD <15
Días AVG OVD 16 -30
Días AVG OVD 31-60
…
… … … … … … … … … … …
¿QUÉ PRODUCTOS A QUÉ CLIENTE? VENTA CRUZADA!
Rubro N° Cliente: 123456 Categoría
CC Moneda Nacional No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
# Trans. Web
Nivel 1
# Trans. Web
Nivel 2
# Trans. ATM
Nivel 1
# Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
CC Moneda Extranjera No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
#Trans. Web
Nivel 1
#Trans. Web
Nivel 2
#Trans. ATM
Nivel 1
#Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
Plazo fijo M. Ext. No Tiene Capital Nivel 1
Capital Nivel 2
Capital Nivel 3
Plazo: 3m
Plazo: 6m
Plazo: 12m
Solicita Web
Solicita Sucursal …
Préstamo Hipotecario No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 120
cuotas
Plazo: 120 - 180
cuotas
Plazo: 180 y + cuotas
Solicita Web
Solicita Sucursal …
Préstamo Automotor No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 12 cuotas
Plazo: 12 - 18 cuotas
Plazo: 18 y + cuotas
Solicita Web
Solicita Sucursal …
Sobregiros No TieneSobregiro AVG Nivel 1
Sobregiro AVG Nivel 2
Meses c/ OVD
<3/12
Meses c/ OVD 3-6/12
Meses c/OVD 6-12/12
Días AVG OVD <15
Días AVG OVD 16 -30
Días AVG OVD 31-60
…
… … … … … … … … … … …
¿QUÉ PRODUCTOS A QUÉ CLIENTE? UP SELLING!
Rubro N° Cliente: 123456 Categoría
CC Moneda Nacional No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
# Trans. Web
Nivel 1
# Trans. Web
Nivel 2
# Trans. ATM
Nivel 1
# Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
CC Moneda Extranjera No Tiene
Balance AVG
Nivel 1
Balance AVG
Nivel 2
#Trans. Web
Nivel 1
#Trans. Web
Nivel 2
#Trans. ATM
Nivel 1
#Trans. ATM
Nivel 2
# Trans. Suc.
Nivel 1
# Trans. Suc.
Nivel 2…
Plazo fijo M. Ext. No Tiene Capital Nivel 1
Capital Nivel 2
Capital Nivel 3
Plazo: 3m
Plazo: 6m
Plazo: 12m
Solicita Web
Solicita Sucursal …
Préstamo Hipotecario No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 120
cuotas
Plazo: 120 - 180
cuotas
Plazo: 180 y + cuotas
Solicita Web
Solicita Sucursal …
Préstamo Automotor No Tiene Capital
Nivel 1Capital Nivel 2
Capital Nivel 3
Plazo: 12 cuotas
Plazo: 12 - 18 cuotas
Plazo: 18 y + cuotas
Solicita Web
Solicita Sucursal …
Sobregiros No TieneSobregiro AVG Nivel 1
Sobregiro AVG Nivel 2
Meses c/ OVD
<3/12
Meses c/ OVD 3-6/12
Meses c/OVD 6-12/12
Días AVG OVD <15
Días AVG OVD 16 -30
Días AVG OVD 31-60
…
… … … … … … … … … … …
VENTA CRUZADA Y UP SELLING!
PRODUCTOS
¿QUÉ PRODUCTOS A QUÉ CLIENTE?
OFERTAS / PROMOS
LANZAMIENTO
RE-LANZAMIENTO
LISTADO DE PRODUCTOS PARA CADA
CLIENTE
LISTADO DE PRODUCTOS
PARA PROMOCIÓ
N
CLIENTE
SBC 1to1
CROSS SELLING
STD SALES
UP SELLINGPROMOCIONES 1TO1
BASADAS EN PREFERENCIAS
PROMOCIONES 1TO1 BASADAS EN
PREFERENCIAS
Se pueden presentar en:
• Website de la institución• Móviles, transacciones, consultas, mensajes.• PC de Ejecutivos de Cuentas.• Telemarketing• Call Center• ATM• Otros…….
EJEMPLO PUBLICITARIO DE SUGERENCIAS PERSONALIZADAS DE UN CABLE DE TELEVISIÓN
Minería de Datos
Aumentar Ventas
Mitigar Riesgos y Pérdidas
Reducir Costos
INCIDENCIA DE MINERÍA DE DATOS EN EL ÉXITO EMPRESARIAL
Analítica tiene poder de decisión:
RetenciónCliente
RespuestaCampañas
Tasas deAdquisición
ConversiónOnline
Fraude CrimenGastos Riesgo
CICLO DE VIDA DEL CLIENTE VS MODELOS DE MINERÍA DE DATOS
ADQUISICIÓN CONVERSIÓN MEJORAMIENTO VALOR RETENCIÓN RE-ACTIVACIÓN
Segmentación
Campañas a Targets
Promoción
Propensión de Abandono
Win-back
Costo de Adquisición
Costos de Servicio
Cross y Up Sell
Alerta Caída de Consumo
MBA
Ciclo de vida rentable Ciclo de vida menos rentable
Técnicas Descriptivas (aprendizaje no supervisado)
Técnicas Predictivas (aprendizaje supervisado)
ALGUNAS DE LAS PRINCIPALES TÉCNICAS DE MINERÍA DE DATOS:
• Clustering Jerárquico, • K-medias, • Clustering Bietápico,…
• Reglas de Asociación,• Análisis Secuencial,• Análisis de Tendencias,…
• Regresión Logística, • Árboles de Decisión, • Redes Neuronales, • Vecino más Cercano,• Regresión Múltiple, • Otros,…
CREDIT SCORING, PROPENSIÓN DE ABANDONO, DE COMPRA, MOTOR DE
SUGERENCIAS, otros.
Market Basket Analysis, otros
SEGMENTACIÓN
FUNCIONES DE LAS TECNICAS DE MINERIA DE DATOS:
Asociaciones85% de clientes que compraron un cierto tipo de marca de vino, también compraron cierto tipo de pasta.
Patrones secuenciales32% de los clientes femeninos que compraron una campera roja dentro de los 6 meses compraron también una camisa gris.
ClasificaciónClientes frequentes con ingresos de $ 5.000 y que tienen dos o más hijos/as.
ClusteringSegmentación transaccional de mercado.
Aplicación de Análisis Predictivo:
Qué es predecible?: Cuál es la decisión de negocio?:
Marketing Directo Respuesta del Cliente Reducción de los costos de contacto?
Retención de Clientes
Abandono de Cliente Retener, enviar propuesta de retención?
Recomendación de Productos
Qué necesita o quiere cada cliente
Qué producto/servicio recomendar?
Publicidad de contenido
A cuál responderán? Qué contenido publicitar?
Valor Vitalicio Qué tan rentable será cada cliente
Cuánto invertir?
Detección de Fraude Si las transacciones son legítimas
Cuándo y dónde investigar?
Credit scoring Riesgo del Deudor Otorgar o no el crédito?Selección y precio del seguro
Riesgo asegurado Si se cubre y cuál sería el precio?
· Los almacenes de datos no son imprescindibles para hacer extracción de conocimiento a partir de datos.
· se puede hacer minería de datos sobre un simple fichero de datos.
· Las ventajas de organizar un almacén de datos para realizar minería de datos se amortizan sobradamente a medio y largo plazo cuando:
· tenemos grandes volúmenes de datos, o· éstos aumentan con el tiempo, o· provienen de fuentes heterogéneas o· se van a combinar de maneras arbitrarias y no predefinidas.
¿ES NECESARIO TENER ALMACENES DE DATOS PARA REALIZAR MINERÍA DE DATOS?
BASES DE DATOS Y MINERÍA DE DATOS
• El aumento del volumen y variedad de información que se encuentra informatizada en bases de datos digitales ha crecido espectacularmente en la última década.
• Gran parte de esta información es histórica, es decir, representa transacciones o situaciones que se han producido.
• Aparte de su función de “memoria de la organización”, la información histórica es útil para predecir la información futura.
MOTIVACIÓN DEL MERCADO
NUEVAS NECESIDADES DEL ANÁLISIS DE GRANDES VOLÚMENES DE DATOS
• La mayoría de decisiones de empresas, organizaciones e instituciones se basan también en información de experiencias pasadas extraídas de fuentes muy diversas.
• las decisiones colectivas suelen tener consecuencias mucho más graves, especialmente económicas, y se debe a que se basan en volúmenes de datos que hoy desbordan la capacidad humana.
MOTIVACIÓN DEL MERCADO
• Tamaño de datos poco habitual para algoritmos clásicos:• número de registros muy largo• datos altamente dimensionales (nº de
columnas/atributos).• El usuario final no es un experto en aprendizaje automático ni
en estadística. • El usuario no puede perder más tiempo analizando los datos:
• industria: ventajas competitivas, decisiones más efectivas.• Los sistemas clásicos de estadística son difíciles de usar y no
escalan al número de datos típicos en bases de datos.
MOTIVACIÓN DEL MERCADO
> Mercado: Desde un foco de servicios a un foco en el cliente 1to1!
> IT: Desde un foco en balances contables actualizados a un foco en patrones en las transacciones Herramientas: Data Warehouses, OLAP
> Dramática reducción en los costos de almacenaje de datos: Ej.: Walmart: 30 millones de transacciones/día, 10 TB Ej.: Blockbuster: registros de mas de 46 millones de familias
> Captura automática de transacciones Ej.: Código de barras, POS devices, ATM (cajeros automáticos),
clicks de mouse, Datos de localización (GPS, smart phones, tablets, etc. )
> Internet: Interacciones personalizadas (Amazon.com, EBAY.com)
FACTORES DEL MERCADO PARA LLEVAR A CABO MINERÍA DE DATOS
> Para Sector Financiero> Para Sector de Seguros> Para Sector Retail (supermercados, cadenas de
restaurantes, etc.)> Para Sector Telecomunicaciones> Para Sector Gobierno> Otros
SECTORES DONDE MINERIA DE DATOS APLICA:
> Target: Bancos, Cooperativas, Tarjetas de Crédito, Corredores de Bolsa, etc.
> Adoptaron temprano las aplicaciones de Data Mining.> “The right relationship is everything”.> Retención de clientes> Ventas cruzadas> Maximización de campañas de MKTG y promociones.
SECTOR FINANCIERO
> Maximización de dinero en ATMs (cajeros automáticos)> Administración de riesgo> Predecir malos préstamos> Detección de lavado de dinero y fraude> Target Marketing: Identificar clientes potenciales para nuevos
productos (préstamo, bono, etc.) al mismo tiempo que maximizar y efectivizar los costos de marketing. (útil para todos los sectores del mercado). Veamos ejemplo.
SECTOR FINANCIERO
TARGET MARKETING
> Problema ($$$): Uso de extensas listas de clientes para realizar campañas de mailing
directo
> Solución: Uso de Minería de Datos para identificar las respuestas más
prometedoras mediante la combinación de datos geográficos y demográficos con datos del comportamiento de compra en el pasado de los clientes
> Beneficio: Mejor tasa de respuesta Ahorro en los costos de las campañas publicitarias Utilización de canales preferidos por los clientes
> Rediseñó la infraestructura de Servicio al cliente, incluyó una inversión de US$ 38 millones en un data warehouse y automatización de marketing.
> Utilizó regresión logística para predecir las probabilidades de respuesta de un producto “home-equity” a una muestra de 20.000 perfiles de clientes de una base de datos de 15 millones.
> Utilizó CART para predecir los clientes rentables y cuáles serían no rentables incluso si responden positivamente al nuevo producto ofrecido.
EJEMPLO: ABC FINANCIAL GROUP
> Detección de fraude> Detección de lavado de dinero> Programa de retención de clientes> Medidas de riesgos por cliente> Identificar los recursos suficientes para cubrir
responsabilidades (siniestros) de manera eficiente> Venta cruzada
SECTOR SEGUROS
> Predecir el comportamiento y hábito de compra del cliente.> Análisis de la canasta de compra (MBA)> Hacer mas eficiente y efectiva las campañas de MKTG y de
promociones.> Reducir sustancialmente los costos de mailing.> Ej.: pañales # ………….
SECTOR RETAIL
SECTOR TELECOMUNICACIONES
> Identificar clientes que fueran atraídos a un nuevo servicio.
> Alcanzar a dicho target de la manera mas eficiente y efectiva.
> Usualmente, entre 2 y 3 % responden a una campaña tradicional.
CAMPAÑAS MAS EFICIENTES:
Contactos
100
200
300
400
Mail masivo
Mail identificado
ahorro
2000 4000 6000 8000 10000 12000 14000 16000 18000
> SPSS> SAS> R> Intelligent Miner> MineSet> DBMiner> CART> HNC´s FALCON> Otras…………………
HERRAMIENTAS PARA ESTADÍSTICAS
HERRAMIENTAS:
> 1. Identificar oportunidades y beneficios para el negocio donde el análisis de datos puede proveer valor agregado. Podemos comenzar por una unidad de negocio, con una necesidad puntual.
> 2. Transformar los datos en información útil y con poder de acción usando técnicas de Minería de Datos.
> 3. Actuar en base a la información obtenida
> 4. Medir los resultados de los esfuerzos
CICLO DE VIDA DE DM
> 1. Identificar oportunidades y beneficios para el negocio donde el análisis de datos puede proveer valor agregado:
• Planificar un lanzamiento de un nuevo producto• Planificar campañas de marketing directo para venta
cruzada• Retener clientes• Pregunta: en su Departamento?
CICLO DE VIDA DE DM
> 2. Transformar los datos en información útil y con poder de acción usando técnicas de Minería de Datos
• Éxito se define como adquirir un sentido del negocio partiendo de los datos y no de la utilización de una técnica en particular.
A considerar:• Formato de datos ineficiente• Campos/variables confundibles
CICLO DE VIDA DE DM
> 3. Actuar en base a la información obtenida
• Envío de mensajes a distintos clientes a través de sus canales preferidos
• Priorizar Servicio al Cliente• Ajuste de niveles de inventario
CICLO DE VIDA DE DM
> 4. Medir los resultados de los esfuerzos
• La campaña alcanzó y trajo los clientes mas rentables?• Fueron esos clientes retenidos como se esperaba?• Cuáles son las características de los clientes mas leales
alcanzados por esta campaña?• Compraron productos adicionales?• Qué tipo de mensaje fue mas beneficiosos para la empresa?• Valor de los clientes………….
CICLO DE VIDA DE DM
METODOLOGÍA CRISP – DMCROSS INDUSTRY STANDARD PROCESSING FOR DATA
MINING:
Análisis del Negocio Comprensión de Datos
Preparación de datos Modelado Evaluación Desarrollo
Determinación de Objetivos del Negocio
Evaluación de la Situación
Determinación de Objetivos deData-Mining
Producción del Plan de Negocios
Background Objetivos Negocio
Criterio de "Éxito”
Inventario d Recursos
Supuestos,Restriccio-
nes
Riesgos y Contingen-
cias
Termino-logía
Metas de DM
Criterio de “éxito” DM
Plan de Proyecto
Evaluación de técnicas
Análisis del Negocio
Comprensión de Datos
Preparación de datos Modelado Evaluación Desarrollo
Recolección inicial de datos
Descripción de datos
Exploración de datos
Verificación de la calidad de
los datos
Reporte Recolección
de datos
Reporte de exploración
de datos
Reporte de calidad de
datos
Reporte de Descriptivos
Análisis del Negocio
Comprensión de Datos
Preparación de datos Modelado Evaluación Desarrollo
Seleccionar Datos
Limpieza de datos
Construcción de variables
Integración de datos: Aplanado
Razones inclusión y/o
exclusión
Atributos derivados
Fundido de archivo:
aplanado
Reporte de Limpieza de datos
Registros generados
Formato de datos Dar formato
a la base de datos
Descripción de base de
datos
Análisis del Negocio
Comprensión de Datos
Preparación de datos Modelado Evaluación Desarrollo
Seleccionar Datos
Limpieza de datos
Construcción de variables
Integración de datos: Aplanado
Formato de datos
Selección de Técnicas de Modelado
Generación de diseños de
prueba
Construcción del Modelo
Evaluación del Modelo
Evaluación de Resultados
Revisión del Procedimiento
Determinación de pasos a seguir
Despliegue de Resultados
Evaluación de Formas de
Mantenimiento
Reporte final del proyecto
Análisis del Negocio
Comprensión de Datos
Preparación de datos Modelado Evaluación Desarrollo
Seleccionar Datos
Limpieza de datos
Construcción de variables
Selección de Técnicas de Modelado
Generación de diseños de
prueba
Construcción del Modelo
Evaluación de Resultados
Revisión del Procedimiento
Despliegue de Resultados
Evaluación de Formas de
Mantenimiento
Integración de datos: Aplanado
Evaluación del Modelo
Determinación de pasos a seguir
Reporte final del proyecto
Análisis del Negocio
Comprensión de Datos
Preparación de datos Modelado Evaluación Desarrollo
Seleccionar Datos
Limpieza de datos
Construcción de variables
Selección de Técnicas de Modelado
Generación de diseños de
prueba
Construcción del Modelo
Evaluación de Resultados
Revisión del Procedimiento
Despliegue de Resultados
Evaluación de Formas de
Mantenimiento
TIEMPOS ESTIMADOS UTILIZANDO CRISP-DM PARA MODELOS:
SEGMENTACIÓN BASADA EN EL COMPORTAMIENTOCREDIT SCORINGPROPENSIÓN DE ABANDONO
Conocimiento del negocio
• Identificar los objetivos
• Análisis de la situación
• Determinación de objetivos de DM
• Creación del plan del proyecto
Análisis de los datos
• Recolección de datos
• Descripción de los datos
• Exploración de los datos
• Verificación de la calidad de los datos recolectados
Preparación de los datos
• Selección de datos
• “Limpieza” de datos
• Construcción de datos
• Integración y formato de los datos
Modelado
• Selección de técnicas de modelado
• Generar un diseño de test
• Construcción del modelo
• Evaluación del modelo
Evaluación
• Evaluación de los resultados obtenidos
• Revisación del proceso aplicado
• Determinación de próximos pasos a seguir
Desplegar
• Diseño del plan de despliegue del modelo
• Diseño del plan de mantenimiento y monitoreo
• Creación del reporte final
7 semanas 8 semanas 4 semanas
AUTOMATIZAMOS…MEDIMOS….
Data Warehouse
Fuentes propias y/o externas
SQL,Oracle,MySQL
Herramienta estadística genera:
2. Procesos de Automatización:
1. Algoritmo del modelo:
Aplicación tecnológica
3. Reportes y listados:
SEGUIMIENTO DE GESTIÓN EMPRESARIAL:
SISTEMA DE INFORMACION GERENCIAL:
TOTAL EMPRESAS PERSONAS TARJETAS
Clientes
Productos
Sucursales
CLIENTES:SEGMENTOS,FRECUENCIA,ATRASOS,% UTILIZACIÓN DE SERVICIOS,% PARTICIPACIÓN PROMOCIONES,ETC.
Notifica
Controla
Monitorea
Analiza
Reportea
Planifica
Sistema de Información Gerencial
Realizar planeamiento empresarial de manera rápida y eficiente.Analizar diversas opciones para tomar la decisión mas correcta. Crear, comparar y evaluar escenarios de negocios, condiciones y supuestos.
Enviar alertas de eventos críticos de su operativa en forma automática e inmediataLas alertas pueden contener toda la información necesaria para tomar una decisión en ese momento.
Tableros de control son instrumentos que comunican la información del negocio compleja rápidamente. Traduce los datos de sus sistemas a elementos gráficos para demostrar y comparar resultados múltiples juntos.
Monitorear el desempeño de la organización por medio de indicadores que reflejan donde está la empresa y hacia donde se dirige Esto último, a través de métricas fáciles de monitorear y entender.
Sistemas que visualizan valores organizados en múltiples perspectivas o dimensiones. Permite analizar los hechos sucedidos para descubrir las causas de los problemas u oportunidades de negocio.
Elaborar informes empresariales en tiempo real .
EJEMPLO: TENDENCIA DE VENTAS ($ Y #) DE NUEVAS CUENTAS CORRIENTES EN LA SUCURSAL VILLA MORRA DURANTE EL MES OCTUBRE 2009 (DÍA A DÍA Y EN COMPARACIÓN CON OCT. 2008):
Analizar mes a mes el movimiento de sus clientes dentro de los segmentos
Detectar el incremento de los segmentos mas riesgosos para su empresa
Analizar de donde provienen los clientes que se movieron. Analizar si estas
tendencias tienen o tendrán impacto en su empresa
EJEMPLO SEGUIMIENTO DE SEGMENTACION:
Detectar los clientes con una alta propensión de compra.
Analizar si es rentable retener a todos.
Generar Targets de clientes con propensidad de compra y/o de abandono.
Administrar campañas
Monitorear la efectividad de sus campañas.
EJEMPLO DE PANTALLA PROPENSION DE ABANDONO:
HASTA AHORA………..:
Mejores decisiones operacionales resultan en aumento del ROI
Modelos Predictivos pueden mejorar las decisiones operacionales
Se necesita:Dar el primer paso........Enfocarse en acciones.......Rápida implementación.......Unidades de Negocio y Sistemas comprometidos(Equipo multidisciplinario)Transmitir la experiencia y motivar.......
CONOCER NO ES SUFICIENTE:
Aquellos que conocen primero, ganan.
Aquellos que ACTUAN primero, ganan
Asumiendo que ACTUAN inteligentemente
MEJORAMOS LA PERFORMANCE DE LA EMPRESA CONOCIENDO EN PROFUNDIDAD A NUESTROS CLIENTES
Mód
ulo
4Segmentación Basada en el Comportamiento Transaccional (histórico de datos, registros)
Ejemplos de distintos sectores
SEGMENTACION BASADA EN EL COMPORTAMIENTO:
Obtener segmentos homogéneos de clientes según patrones de comportamiento de consumo de servicios/productos, para así:→ Identificar a los mejores clientes y establecer estrategias de retención.→ Establecer estrategias específicas para cada segmento, por ejemplo:
• Para motivar el aumento del volumen de operaciones • Incentivar el consumo de diferentes productos • Educar y fidelizar ciertos clientes• Desarrollar nuevos productos financieros
1. Conocer en profundidad la Cartera de Clientes
Utilizar el modelo obtenido como base para la realización de proyectos de Lanzamiento de campañas (retención, expansión, promoción, etc.), propensión de abandono, ventas cruzadas, MBA, sugerencias personalizadas.
2. Establecer la base para otros proyectos
Particiona la cartera de clientes en base al perfil de compras y hábitos generales de consumo de cada cliente.
PORQUÉ SEGMENTACIÓN BASADA EN EL COMPORTAMIENTO: ¿Quiénes son sus clientes más rentables? ¿Cuáles conviene retener y cuáles no?
¿Cuál es la probabilidad de incumplimiento de pago de sus clientes?
¿Cómo identifica las mejores oportunidades de venta cruzada?
¿Cuál es la frecuencia, recencia y valor vitalicio de cada cliente?
¿Cuáles son los clientes que piensan reemplazar sus servicios por los de la competencia? ¿Por qué? ¿Cómo los identifico a tiempo?
¿Cuáles son los clientes más propensos a responder positivamente a una nueva promoción?
“CONOCER MI CLIENTE”:
• Quién es mi cliente?• Qué Frecuencia tiene?• Qué valor monetario tienen? Y los márgenes?
1. IDENTIFICACION
• Qué servicios utilizan?• Qué estilo de vida tienen? Sus preferencias?• Hacia dónde van (tendencias)?• A qué segmento pertenecen?
2. CATEGORIZACION
• Qué grado de fidelidad tienen con nuestra empresa?• Qué propensidad de comprar tienen sobre servicio X?• Cuáles serán el foco a corto, mediano y largo plazo?
3. JERARQUIZACION
SEGMENTACION RETAIL
Patrón de Visitas
Alto
Medio
Bajo
Gast
o
Diario 2 veces
por semana
Semanal De vez en cuando Casi nunca Lapsos Se
Fue
PREMIUM (ej.: 12%) : SEG. 1
VALORABLE (ej.: 19%) POTENCIAL (25%)
NO COMPROMETIDOS (39%)
LAPSOS (6%)
SE FUE
FASE I: OBTENCIÓN DE PATRONES DE USO
INSUMOS: TODOS LOS TICKETS DE COMPRA Y DATOS DE TARJETA DE FIDELIDAD
NOTEBOOKS
SALUD & BELLEZA
ANIMALES & MASCOTAS
SBC: EJEMPLO DE SEGMENTACIÓN DE CLIENTES
FASE I: FASE II (descriptiva)
NOTEBOOKS ANIMALES & MASCOTAS
CELULARES
CELULARES
SALUD & BELLEZA
REPUESTOS AUTOMÓVILES
SEGMENTO 1(Alta Fidelidad,
Frecuencia y Gasto)
SEGMENTO 2 (Alta Fidelidad y
Frecuencia; Gasto Moderado)
SEGMENTO 5 (Clientes No Frec.s)
ACCESORIOS COMPUTACIÓN
REPUESTOS AUTOMÓVILES
ACCESORIOS COMPUTRACIÓN
Global STD SIN DEC FAN EXT
Cantidad Clientes252.962 163.237 44.164 16.505 27.228 1.828
Cantidad Visitas 3,23 2,91 0,17 0,81 10,09 24,03Importe AVG Visitas 388 2,9 0,175 0,81 10,09 24,03
Frecuencia (días)9,3 267 367 1855 472 730
Recencia (días) 32,2 10,28 171,73 36,92 2,97 1,25% Fin de Semana
30% 23,19 82,46 38,41 3,5 1,43
Sucursal Estable 67% 30% 40% 54% 30% 27%
Global STD SIN DEC FAN EXT
Cantidad Clientes252.962 163.237 44.164 16.505 27.228 1.828
Cantidad Visitas 3,23 2,91 0,17 0,81 10,09 24,03Importe AVG Visitas 388 267 367 1855 472 730
Frecuencia (días)9,3 10,28 171,73 36,92 2,97 1,25
Recencia (días) 32,2 23,19 82,46 38,41 3,5 1,43% Fin de Semana
30% 30% 40% 54% 30% 27%
Sucursal Estable 67% 61% 28% 89% 65% 85%
SBC: EJEMPLO DE SEGMENTACIÓN DE CLIENTES
RESULTADOS:
SEGMENTO 1SEGMENTO 2
SEGMENTO 3
SEGMENTO 4
SEGMENTO 5
Artículos por visita
Cantidad de Visitas
FAN: 10% de clientes, 40% de facturación.
EXTREMOS: menos de 1% de clientes, 10% de ventas!!!.
CONSUMO ESTANDAR:65% de los clientes, 40% de ventas.
SBC: EJEMPLO DE SEGMENTACIÓN DE CLIENTES
SIN FIDELIZAR: 18% de clientes, menos de 1% de las ventas
DECIDIDO: 7% de clientes. Muy Pocas visitas, pero compran varios artículos por visita. Significan 8% de las ventas totales.
Generar mayor valor para el cliente: Fidelizar!
Crear productos y servicios a medida
Multiplicar las oportunidades de nuevas ventas
Crecer en mercados maduros
Lanzar estrategias personalizadas de Cross Selling & Up Selling
Procedimiento y Técnicas Utilizadas:
1. Análisis descriptivo de los datos Univariante, Correlaciones y Multivariante.
2. Determinación del Training Set, Testing Set y Validation Set
3. Estandarización de los datos Transformación de variables, evaluación de datos faltantes, medidas correctivas de
datos faltantes, otros.
4. Aplicación de Componentes principales Selección de dimensiones, evaluación de componentes y significado de nuevas
variables.
5. Aplicación de Clustering Jerárquico(sobre componentes y variables originales): Corrida de Clustering, evaluación de resultados entre muestras y determinación de
cantidad de grupos finales.
6. Evaluación de consistencia del modelo: Comparación entre tamaños y conceptos de grupos obtenidos, elección de
método final y determinación de cantidad de grupos finales.
Procedimiento y Técnicas Utilizadas:
I. Segmentar el mercado usando variables de demanda (ej. Necesidades de cliente, beneficios vistos, soluciones a problemas deseados, situaciones de uso, etc.)
II. Describir los segmentos de mercado identificados usando variables que ayudan a la empresa a entender:
• como servir mejor a sus clientes (ej.: patrones de compra, ubicación geográfica, poder de compra, etc.)
• a comunicarse (preferencia de medios, actitudes, actividades, intereses, opiniones, etc.)
• los costos de cambio del comprador (costos asociados con el cambio de producto o de proveedor).
ETAPAS DE SEGMENTACION:
III. Evaluar que tan atractivos son los segmentos usando variables que cuantifiquen (tasa de crecimiento) las posibilidades de cada segmento; y los costos de atender a cada segmento.
IV. Seleccionar uno o mas segmentos target para servir basados en el potencial de ganancia de los segmentos y que acompañen la estrategia de la compañía.
V. Identificar el concepto de posicionamiento de los productos y servicios de la compañía que atraerán a los clientes target.
ETAPAS DE SEGMENTACION:
APLICACIÓN MAS UTILIZADA DE MINERÍA DE DATOS PARA SEGMENTAR: CLUSTERING
> Propósito de Clustering es identificar una colección de características que tienen propiedades similares en un grupo.
> Presumimos las mismas similitudes entre todos los integrantes del grupo.
> Interesante, útil, beneficioso? Por qué?:
> Identificar clientes de alto valor,> Clientes con alto nivel de riesgo,> Instancias de fraude, etc., etc.
III
III
Dimensión 1Dim
ensión 2
MÉTODO MAS UTILIZADO: CLUSTERING.
> Obtiene la Probabilidad Predecible de Compra
> Aplica la ecuación a toda la BD.
> Luego, utiliza el dato para calcular la rentabilidad esperada de esos clientes.
> Envía la campaña (Marketing Directo) a aquellos donde la rentabilidad esperada supera el costo de alcanzar a dicho segmento.
SEGMENTACION: Choice-Based
Cliente Probabilidad de compra Promedio de compra Margen Rentabilidad por cliente1 30% $31 0,70 $6,512 2% $143 0,60 $1,723 10% $54 0,67 $3,624 5% $88 0,62 $2,735 60% $20 0,58 $6,966 22% $60 0,47 $6,207 11% $77 0,38 $3,228 13% $39 0,66 $3,359 1% $184 0,56 $1,03
10 4% $72 0,65 $1,87$37,20
> Promedio esperado de ganancia: $3,72> Costo de alcanzar a cada cliente: $3,50> Ganancia: (10 x ($3,72 - $3,50) = $2,20
SEGMENTACION: Choice-Based
> Promedio esperado de ganancia: $3,72> Costo de alcanzar a cada cliente: $3,50> Ganancia: $6,51 + $ 3,62 + $6,96 + $6,20 – (4 x 3,50) = $9,29
Cliente Probabilidad de compra Promedio de compra Margen Rentabilidad por cliente1 30% $31 0,70 $6,512 2% $143 0,60 $1,723 10% $54 0,67 $3,624 5% $88 0,62 $2,735 60% $20 0,58 $6,966 22% $60 0,47 $6,207 11% $77 0,38 $3,228 13% $39 0,66 $3,359 1% $184 0,56 $1,03
10 4% $72 0,65 $1,87$37,20
SEGMENTACION: Choice-Based
> $2,20 o $9,29?
> Conclusión: utilizando Segmentación Choice Based, la compañía aumenta la rentabilidad de la campaña en un 400%.
> Es decir es más…….
SEGMENTACION: Choice-Based
SBC EN BASE A CUENTAS
SBC EN BASE A CRÉDITOS
Cada cliente (persona física o jurídica) será segmentada según su comportamiento en CUENTAS, CRÉDITOS (Historial y Atraso), y TARJETAS DE
CRÉDITO (Compras y Atraso) de manera independiente
SBC EN BASE A TARJETAS
ESTRATEGIA DE SEGMENTACIÓN PARA INSTITUCIONES FINANCIERAS:
ENFOQUE DE SEGMENTACIÓN MÚLTIPLE PERMITE OPTIMIZAR SU UTILIZACIÓN PARA FINES COMERCIALES Y CONTROL DE RIESGO CREDITICIO
EJEMPLO: SEGMENTACIÓN DE TARJETAS DE CRÉDITO
2. MODALIDAD DE COMPRAS
3. CATEGORIZACIÓN DE COMPRAS
CÓMO COMPRA?
QUÉ COMPRA?
1. SBC VOLUMEN
CUÁNTO COMPRA?
LA SEGMENTACIÓN DE CLIENTES EN BASE A USO DE TARJETAS DE CRÉDITO CONSTA DE MÚLTIPLES FASES:
COMPLETO POSICIONAMIENTO DEL CLIENTE BASADO EN SUS COMPRAS Y PAGOS
4. PAGOS Y ATRASO
CÓMO PAGA?
CLIENTES TARJETAS DE CRÉDITOSEGMENTACIÓN CON VARIABLES TRANSACCIONALES
Global A+ A- B+ B- C+ C-
Cantidad de Clientes 224.797 18.075 23.267 52.504 30.983 65.741 34.228
Cant. AVG Compras mensuales 4,23 15,78 4,39 6,42 2,94 1,94 0,42
Imp. AVG Compras mensuales 3.133 12.588 2.726 4.555 1.673 1.632 442
AVG Monto Disponible 15.300 39.404 9.808 21.003 7.477 11.645 11.661
Utilización AVG del Disponible 38,5% 44,6% 54,1% 36,1% 57,1% 33,3% 21,9%
Atraso mayor a 31 días 10,2% 2,8% 12,4% 1,9% 29,8% 4,3% 18,7%
AVG Cap.Financiado / Límite Crédito 8% 7% 13% 1% 42% 1% 1%
Participación en Promociones 13% 44% 17% 18% 12% 4% 2%
Global A+ A- B+ B- C+ C-
Cantidad de Clientes 224.797 18.075 23.267 52.504 30.983 65.741 34.228
Cant. AVG Compras mensuales 4,23 15,78 4,39 6,42 2,94 1,94 0,42
Imp. AVG Compras mensuales 3.133 12.588 2.726 4.555 1.673 1.632 442
AVG Monto Disponible 15.300 39.404 9.808 21.003 7.477 11.645 11.661
Utilización AVG del Disponible 38,5% 44,6% 54,1% 36,1% 57,1% 33,3% 21,9%
Atraso mayor a 31 días 10,2% 2,8% 12,4% 1,9% 29,8% 4,3% 18,7%
AVG Cap.Financiado / Límite Crédito 8% 7% 13% 1% 42% 1% 1%
Participación en Promociones 13% 44% 17% 18% 12% 4% 2%
CLIENTES TARJETAS DE CRÉDITOSEGMENTACIÓN CON VARIABLES TRANSACCIONALES
Buenos compradores, malos pagadores
Fans de débitosautomáticos
Calidad de Pago1
EJEMPLO: MAPA SEGMENTACIÓN TARJETAS DE CRÉDITO
1 Dimensión “Calidad de Pago”: se relaciona con Forma y Fechas de Pagos, Financiación de Capital, Utilización del Límite de Crédito.2 Dimensión “Valor Monetario”: se asocia con frecuencia, importe de compras, otros.
Valor Monetario2
7.000 Clientes ( 2%)-Frecuencia de compra < 1,5 días- 25% del consumo total - Importe mensual de compras $U 18k
10.500 Clientes (3%)- Alta participación en promociones- Cuoteros- Financian Capital 9/12 meses- Alta utilización del Límite de Crédito
31.000 Clientes ( 10%)- Frecuencia de utilización cada 30 días,
principalmente en débitos automáticos. - Casi no realizan compras- No participan en promociones
Mód
ulo
5 Modelos Predictivos:Generalidades técnicas
Ejemplos:Propensión de Abandono Credit Scoring
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
EJEMPLO DE MODELO PREDICTIVO:
PROPENSIÓN DE ABANDONO (CHURN ANALYSIS)
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
OBJETIVOS
MONITOREAR Y CONTROLAR EL ABANDONO
AUMENTANDO INGRESOS AL FIDELIZAR LA CARTERA
PROPENSIÓN DE ABANDONO SEGMENTACIÓN BASADA EN EL COMPORTAMIENTO
PROPENSIÓN DE ABANDONO: OBJETIVOS
Predecir el abandono de afiliados
Se estableció como objetivo predecir el abandono de afiliados mediante el análisis del comportamiento histórico de los mismos.
De esta manera se identifican las causas de la pérdida de afiliados.
Cada afiliado/a y/o núcleo obtendrá un score de una escala que deberá reflejar su proximidad a abandonar los servicios que la empresa les provee.
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
ESTRATEGIA:
Predecir el abandono de afiliados
Se estableció como objetivo predecir el abandono de afiliados mediante el análisis del comportamiento histórico de los mismos.
De esta manera se identifican las causas de la pérdida de afiliados.
Cada afiliado/a y/o núcleo obtendrá un score de una escala que deberá reflejar su proximidad a abandonar los servicios que la empresa les provee.
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
PROPENSIÓN DE ABANDONO LE PERMITE:
QUÉ ES “CHURN ANALYSIS”?
Obtención de una Escala de Riesgo de Abandono, donde pueda identificarse cuáles son los clientes más propensos a abandonar.
Captar un cliente nuevo es muchas veces más caro que retenerlo!
RESULTADO
→ Retener proactivamente posible abandono de clientes.→ Maximizar la rentabilidad de cada cliente, alargando su ciclo de
vida en la institución.→ Clasificar la cartera de clientes en relación a su probabilidad a
abandonar los servicios que la institución le provee.
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
ESTRATEGIA:
•Servirá para identificar factores asociados al abandono a ser utilizados en la construcción de la fórmula predictiva.
ANÁLISIS DESCRIPTIVO
•Se construye el modelo de predicción obteniendo como resultado una fórmula que permita calcular el riesgo a abandono de todos los clientes.
MODELO DE PROPENSIÓN
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
ANÁLISIS DESCRIPTIVO:
Junio 2009Junio 2004
43.081 bajas*
* Se excluyen los Convenios de Salud y las bajas por fallecimiento.
Punto de inicio Análisis de Bajas
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
38%27%
12%
9%4%4%
2%2%1%
1%1%0%
Acumulación de Cuotas
Dificultades Económicas
Retiro sin confirmar motivo
Cliente nuevo impago
Cese relación laboral (Convenios)
No necesita el servicio / Nunca lo ha uti-lizado
Descontento con el área de Servicios
Demora en llegar el Móvil
Mala información de venta
Error de digitación / Mal ingresado
Cuota elevada
Otros: (Otros productos, Cambio compe-tencia, Insatisfacción con producto, Des-contento Adm.)
Mayor parte de bajas: motivos económicos y/o deuda
ANÁLISIS DE BAJAS: MOTIVOS DE BAJA
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
<= 14 15 - 49 50+
54%
71%
84%
46%
29%
16%
No Abandono Abandono
Franja etariaABC1 C2 D1 D2 E Semirural Sin Datos
84%75%
63% 63%71%
16%25%
37% 37%29%
No Abandono Abandono
Zona de Residencia
CARTERA ACTIVA VS. BAJAS: EDAD Y ZONA DE RESIDENCIA
Existen diferencias significativas entre Tramos de Edad.
Existen diferencias significativas entre algunas Zonas de Residencia
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
PLAN 200 PLAN 300 PLAN 400 PLAN 500 UCM
56%
66% 66%
78%
88%
44%
34% 34%
22%
12%
Plan de CoberturaConve
nio Centraliz
ado
Débito Automáti
co
Domicilia
ria
82% 81%
56%
18% 19%
44%
Canal de Cobranza
CARTERA ACTIVA VS. BAJAS: COBERTURA Y COBRANZA
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
CONCLUSIONES ANÁLISIS DESCRIPTIVO
Existen diferencias sistemáticas entre afiliados que abandonan y aquellos que no lo hacen, en particular, para:
• Antigüedad• Edad• Zona de Residencia• Mutualista• Canal de Afiliación• Canal de Cobranza• Plan de Cobertura• Frecuencia de utilización de servicios
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
Meta:
Construir regla predictiva del abandono de la cartera de afiliados.
Cómo?
• Se analiza comportamiento simultáneo de los afiliados a una fecha específica (Junio 2008).
• Se aplican métodos que permiten detectar diferencias de patrones de comportamiento entre aquellos clientes del stock que permanecen afiliados luego de un año, de aquellos que no.
Junio 2008 Junio 2009Enero 2006
Stock de Afiliados utilizado
CONSTRUCCIÓN DEL MODELO
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
Alcance:
Se obtiene un score en una escala que refleja su proximidad a abandonar los servicios que la empresa provee en los próximos meses.
1: Abandono0: No Abandono
ESCALA de SCORES
PROPENSIÓN DE ABANDONO
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
Mutualista, Barrio, Género, Edad.DEMOGRÁFICO
Antigüedad, Plan de Cobertura, Canal de Afiliación, tamaño y composición del grupo, Canal de Cobranza. VÍNCULO
Consultas Telefónicas
Emergencias, Urgencias, Otro Tipo.
UTILIZACIÓN TELÉFONO
Médico, Especialista y Enfermería.UTILIZACIÓN CLÍNICAS
UTILIZACIÓN MÓVIL
Información sobre cobranza: atrasos, deuda.CONDUCTA DE PAGO Y DEUDA
A incluir en el futuro (más cercano posible):
MODELO ANALÍTICO DE PROPENSIÓN DE ABANDONO:
Dimensiones del modelo:
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
Técnica: Regresión Logística. Software: SPSS Statistics 17; R 2.9.1. Cross validation: construcción del modelo sobre muestra LEARN
(m.a uniforme del 70% de los casos), validado sobre 30% restante (muestra TEST).
Unidades clasificadas: Responsables de pago agrupando comportamiento del núcleo (en caso que RP sea socio); y afiliados individuales (caso contrario).
REGLA PREDICTIVA CONSTRUIDA PARA AFILIADOS CON MENOR ANTIGÜEDAD QUE 30 MESES.
CONSTRUCCIÓN DEL MODELO: DEFINICIÓN DEL MARCO DE ANÁLISIS
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
MODELO DE PREDICCIÓN
Variable a Explicar: Abandono.
• 1 – abandono• 0 – no abandono
Variables explicativas (predictores):
Ver cuadro!
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
PROPENSIÓN DE ABANDONO: NOTAS
PARTICULARIDADES DEL MODELO
→ El modelo de propensión de abandono clasifica a todos los afiliados cuyo responsable de pago tiene hasta 30 meses de antigüedad (grupo donde ocurren 65% de las bajas).
→ Para el cálculo de SCORES se considera el comportamiento conjunto de todos los integrantes de un grupo.
→ Todos los miembros de un núcleo tienen la mismo score de propensión de abandono.
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
RESULTADOS PROPENSIÓN DE ABANDONO*
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
SCORES: ¿QUÉ NÚCLEOS PRESENTAN RIESGO DE ABANDONO?
Punto de Corte: 0.80
Punto de Corte: 0.70
Punto de Corte: 0.55
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
<= 0,05
0,05 - 0,10
0,10 - 0,15
0,15 - 0,20
0,20 - 0,25
0,25 - 0,30
0,30 - 0,35
0,35 - 0,40
0,40 - 0,45
0,45 - 0,50
0,50 - 0,55
0,55 - 0,60
0,60 - 0,65
0,65 - 0,70
0,70 - 0,75
0,75 - 0,80
0,80 - 0,85
0,85 +0
200
400
600
800
1000
1200
1400
1600
1800
2000
Stock Bajas
Canti
dad
de N
úcle
os
VALIDACIÓN DEL MODELO: PRONÓSTICO VS. OBSERVADO
Punto de Corte: 0.55
Punto de Corte: 0.70Punto de Corte:
0.80
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
<= 0,05
0,05 - 0,10
0,10 - 0,15
0,15 - 0,20
0,20 - 0,25
0,25 - 0,30
0,30 - 0,35
0,35 - 0,40
0,40 - 0,45
0,45 - 0,50
0,50 - 0,55
0,55 - 0,60
0,60 - 0,65
0,65 - 0,70
0,70 - 0,75
0,75 - 0,80
0,80 - 0,85
0,85 +0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
BajasStock
VALIDACIÓN DEL MODELO: PRONÓSTICO VS. OBSERVADO
Homogeneidad de clasificación:
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
NIVEL 1: MÁXIMO RIESGO DE BAJA. 82% ABANDONO a 6-12 meses
NIVEL 2: ALTO RIESGO DE BAJA. 66% ABANDONO a 6-12 meses
NIVEL 3: INTEERVALO NO INFORMATIVO. 50% ABANDONO / 50% ACTIVO
NIVEL 4 Y NIVEL 5: BAJO Y MÍNIMO RIESGO DE ABANDONO.
Menos del 10% ABANDONO
EJEMPLO: PROPENSIÓN DE ABANDONO
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
PERFIL DE AFILIADOS CON ALTA PROPENSIÓN DE ABANDONO
CLIENTES TARGET PARA GESTIONAR:
NIVEL 1, 2 Y 3
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
I. Implementar algoritmo de Propensión de Abandono.
II. Seguir agregando variables al modelo que hoy no son incluidas, ej.: comportamiento de pago. Objetivo predecir de manera mas precisa aún los abandonos y la cantidad de ellos.
III. Implementar Segmentación y asociarla a Propensión de Abandono.
IV. Monitorear tendencias de afiliados y analizar reportes.
V. Diseñar estrategia específica de RETENCION para cada grupo de afiliados con propensión de abandono alta.
SUGERENCIAS:
OBJETIVOS DESCRIPTIVO MODELADO RESULTADOS
DISMINUCION DE CONSUMO?
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 230
2000
4000
6000
8000
10000
12000
Importe (IPC)
Media Móvil Trimestral ($ IPC)
Cota Superior
Cota Inferior
Período de “Aprendizaje”
Período de “Prueba”
MEDIDA DE PRUEBA
(Media de MMT período test)
VISIÓN GRÁFICA: CLIENTES ESTABLES
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 230
2000
4000
6000
8000
10000
12000
Período de “Aprendizaje”
Período de “Prueba”
MEDIDA DE PRUEBA
Importe (IPC)
Media Móvil Trimestral ($ IPC)
Cota Superior
Cota Inferior
VISIÓN GRÁFICA: DISMINUCIÓN DE CONSUMO
VISIÓN GRÁFICA: DISMINUCIÓN DE CONSUMO
CAÍDA POR DEBAJO DE COTA INF = 22%
7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 230
2000
4000
6000
8000
10000
12000
Período de “Aprendizaje”
Período de “Prueba”
Importe (IPC)
Media Móvil Trimestral ($ IPC)
VISIÓN GRÁFICA: INCREMENTO DE CONSUMO
Cota Inferior
Cota Superior
MEDIDA DE PRUEBA
VISIÓN GRÁFICA: ¿INCREMENTO DE CONSUMO?
INCREMENTO POR ENCIMA DE COTA SUPERIOR = 2%
DEFINICIÓN DE ESCENARIOS:
Se definen distintos escenarios en relación al nivel de exigencia considerado para la clasificación en cada una de las trayectorias:
¿cuánto cae por debajo de la cota inferior? ¿cuánto sube por encima de cota superior?
ESCENARIO NIVEL DE EXIGENCIA I Nulo
II 20% por encima/debajo de cotas
III 40% por encima/debajo de cotas
DEFINICIÓN DE ESCENARIOS: % DE CAÍDA POR DEBAJO DE COTA INFERIOR
ESCENARIO I
ESCENARIO II ESCENARIO
III
Sin re
stricc
ión (Esc.
I)
Caídas
e Incre
mentos m
ayores
a 20% (E
sc. II)
Caídas
e Incre
mentos m
ayores
a 40% (E
sc. III
)
15,746 5,996 2,175
98,019110,414 115,705
6,137 3,492 2,022
Up Between Down
CANTIDAD DE CLIENTES POR CATEGORÍA (PARA DISTINTOS ESCENARIOS)
CANTIDAD E IMPORTE DE COMPRAS POR CATEGORÍA Global Between Down Up
Escenario I: SIN ESPECIFICACIÓN DE CAÍDA / INCREMENTO
Cantidad de Clientes 119.902 98.019 6.137 15.746$ Prom. Compras Mensual Aprendizaje 4.887,3 4.964,5 5.528,9 4.156,7$ Prom. Compras Mensual Test 5.342,4 5.137,1 2.544,4 7.710,7# Prom. Compras Mensual Aprendizaje 6,1 6,1 7,1 5,6# Prom. Compras Mensual Test 6,3 6,2 3,8 7,8
Escenario II: CAÍDA / INCREMENTO MAYOR A 20% DE COTAS
Cantidad de Clientes 119.902 110.414 3.492 5.996$ Prom. Compras Mensual Aprendizaje 4.887,3 4.961,1 5.152,5 3.373,9$ Prom. Compras Mensual Test 5.342,4 5.329,2 1.649,5 7.735,1# Prom. Compras Mensual Aprendizaje 6,1 6,1 6,5 4,6# Prom. Compras Mensual Test 6,3 6,3 2,5 5,2
Escenario III: CAÍDA / INCREMENTO MAYOR A 40% DE COTAS
Cantidad de Clientes 119.902 116.264 2.022 1.616$ Prom. Compras Mensual Aprendizaje 4.887,3 4.917,5 5.064,3 2.492,2$ Prom. Compras Mensual Test 5.342,4 5.385,7 1.040,6 7.603,2# Prom. Compras Mensual Aprendizaje 6,1 6,1 6,4 3,6# Prom. Compras Mensual Test 6,3 6,3 1,6 6,1
Clasificación vs. Predicción
CLASIFICACIÓN: Para predecir el valor de un atributo categórico (discreto o nominal). Algunas técnicas son:
-Regresión logística-Árboles de Decisión-Support Vector Machine, K Nearest Neighbours, ….
PREDICCIÓN: Para modelar funciones que toman valores continuos (esto es, predecir valores numéricos desconocidos).
- Regresión múltiple- Árboles de regresión
Ejemplos…
• Concesión de créditos• Campañas de marketing dirigido• Diagnóstico médico• Detección de fraudes• Predicción de demanda• Predicción del abandono• Predicción de ventas• ….
Consideraciones generales
Construcción del modelo: muestra de entrenamiento• El conjunto de datos utilizado para construir el modelo predictivo se denomina
muestra de entrenamiento.• Cada caso/tupla/muestra corresponde a una clase predeterminada: los casos de
entrenamiento vienen etiquetados por su atributo de clase.
Uso del modelo: muestra de testeo• El modelo construido a partir del conjunto de entrenamiento se utiliza para
clasificar nuevos datos (muestra test)
Predicción: Técnicas de regresión
Las técnicas de regresión modelan la relación entre una o más variables independientes (predictores) y una variable dependiente (variable de respuesta).
Métodos de regresión más populares:
Regresión lineal (simple y múltiple)Regresión no linealÁrboles de regresión (p.ej. CART)…
La variable dependiente (cuantitativa) y se quiere explicar a través de las variables independientes x1, x2 , …, xn .
Regresión lineal
errorxb...xbxbby nn 22110
Se estiman los coeficientes bi a través del método de mínimos cuadrados (se busca la combinación de coeficientes que minimice el término de error).
De esta manera se obtiene la estimación de y:
nnxb...xbxbby 22110
representa cuánto se espera que incremente la variable a explicar y cuando aumenta en 1 unidad la variable explicativa xi .
De esta manera se puede identificar cuáles son los predictores que tienen mayor relación e impacto en la variable independiente y.
ib
Representación gráfica: Regresión lineal simple
Se busca la recta que minimice la distancia entre cada punto y la
recta (‘la que pasa más cerca de todos
los puntos’).
VALIDACIÓN:
1. Significación del modelo y parámetros:Se realizan pruebas de hipótesis para verificar si el ajuste del modelo es aceptable, y si los parámetros son significativos.
2. Verificación de supuestos: El ajuste del modelo de regresión requiere que se cumplan algunas condiciones, que deben ser testeadas mediante pruebas de hipótesis adecuadas. Entre los supuestos, encontramos:
- el promedio de los errores debe ser 0- los errores deben seguir la distribución normal- los errores deben ser homocedásticos (estar incorrelacionados y tener la misma varianza)
Regresión lineal
Etapas para la construcción de una regresión lineal
Clasificación: Regresión Logística
Objetivo: Explicar una variable cualitativa (categorías) a través de otros factores. Variantes:-Variable a explicar binaria: Regresión Logística Binaria-Variable a explicar múltiples categorías: Regresión Multinomial.
Permite:- Identificar qué factores están relacionados con la variable a explicar- Crear una fórmula para ser utilizada en la predicción de futuros
valores
Regresión Logística Binaria
VARIABLE A EXPLICAR:
La variable a explicar y se recodifica como 1 (si el suceso que se quiere medir ocurre) y 0 (si no):
A través de las variables independientes x1, x2 , …, xn .
suceso el ocurre no si
suceso el ocurre si01
y
Se construye el modelo para predecir la probabilidad de que ocurra el suceso.
Nota: para la estimación de parámetros no se requiere realizar supuestos, por tanto, no deberán verificarse en la instancia de validación.
Representación gráfica
Se crea la función logística (línea azul)
que mejor separe los valores “1” de “0”
Probabilidad de ocurrencia del suceso
1. Selección de variables a incluir como predictoras2. Estimar los parámetros bi asociados a cada variable predictora
(mediante método de máxima verosimilitud)3. Verificar significación de parámetros (prueba de hipótesis). Si un
parámetro bk no es significativo, se deduce que dada la presencia del resto de las variables, la variable k no está relacionada a la variable a explicar.
4. Quitar las variables no significativas y volver a estimar los parámetros. Repetir el procedimiento hasta lograr el modelo óptimo.
5. Validar la clasificación utilizando el conjunto de datos de testing.
Regresión Logística… Procedimiento
La idea es que la regresión logística aproxime la probabilidad de obtener "0" (no ocurre cierto suceso) o "1" (ocurre el suceso) con el valor de las variables explicativas x.
La probabilidad estimada del suceso (p) se aproximará mediante una función logística:
)xb...xbxbb( nnep)Y(P
-
22110111
Para predecir en qué categoría De esta manera, se fija un punto de corte c tal que:
10
ycpycp
VALIDACIÓN:
1. Error de clasificación. Se realizan pruebas de hipótesis para verificar si el ajuste del modelo es aceptable, y si los parámetros son significativos.
2. Verificación de supuestos: No requiere.
Regresión lineal
PRONOSTICADOTotal
% aciertoŶ=0 Ŷ=1
OBSERVADOY=0 # Verdaderos 0 # Falsos 1 # Buenos % Especificidad
Y=1 # Falsos 0 # Verdaderos 1 # Malos % Sensibilidad
Total # Automatizados # Rechazados # Total analizado % Automatizado
% acierto % acierto en automatizados
% acierto en rechazados % Malos % Acierto Global
Tasa Especificidad = V0/B Tasa Sensibilidad = V1/M
Tasa Acierto Global = (V0+V1)/Total Tasa Automatización = (V0+F0)/Total
Tasa Acierto en Automatizados = VB/(VB+FB) Tasa Acierto en Rechazados = VM/(FM+VM)
El resultado del pronóstico depende básicamente del modelo y del punto de corte seleccionado
El resultado observado depende exclusivamente del
comportamiento de los clientes y por lo tanto es externo al modelo
CALIDAD del PODER PREDICTIVO
0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.000%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
SENSIBILIDAD ESPECIFICIDAD TASA ACIERTO GLOBAL
PUNTO DE CORTE P(A)
A mayor especificidad (% “1” bien clasificados) desciende la sensibilidad (%
de “0” bien clasificados).
CALIDAD del PODER PREDICTIVO
hEl área entre la curva de poder
predictivo del modelo para clientes recurrentes y la recta de
indiferencia es de h.
La curva de poder predictivo del modelo aparea las tasas de Sensibilidad y Especificidad para los
diferentes puntos de corte. Cuanto más convexa sea la misma, mayor
capacidad de acople entre ambas medidas y por lo tanto mejor ajuste del modelo
CALIDAD del PODER PREDICTIVO: Curva Cor
Árboles de Clasificación
Árboles de Clasificación
Se pueden crear distintas conformaciones de árboles a partir de los mismos datos. ¿cuál es el mejor?
La que nos proporciona nodos más homogéneos…Necesitamos medir la impureza de un nodo.
Existen distintas medidas…- Ganancia de información (Sesgado hacia atributos con muchos valores diferentes.- Criterio de proporción de ganancia (Tiende a preferir particiones poco balanceadas - con una partición mucho más grande que las otras)- Índice de Gini (Funciona peor cuando hay muchas clases y tiende a favorecer particiones de tamaño y pureza similares).
1. Utilizando medidas de distancias se busca, para cada individuo, los k casos más cercanos.
2. Se clasifica al individuo según el “voto” de sus k vecinos más cercanos.
7-nearest neighbor1-nearest neighbor
? ?Clasificacírculo
Clasificacuadrado
k-NN (Nearest Neighbour):
CONCLUSIONES
LINEAMIENTO GENERAL DE PROYECTO:
2. Actividad: Analizar el comportamiento de los clientes en todas sus dimensiones y obtener la segmentación de la cartera total.
3. Resultado esperado:• Mayor enfoque de la empresa centrado en el cliente• Obtener y administrar mejores resultados al elaborar propuestas
específicas al comportamiento de los clientes• Maximizar el retorno de cada cliente.• Mayores ingresos al realizar acertadas ventas cruzadas.
4. Beneficios al utilizar la “nueva información” de sus clientes:• Obtener la ventaja competitiva en el mercado
local/regional/internacional.• Facilitar el alineamiento de la organización alrededor del cliente• Focalizar las ventas de acuerdo a las necesidades del cliente
1. Objetivo de empresa: “maximizar el ROI conociendo mejor a mi cliente”.
HOJA DE RUTA:
Dar un primer paso (una segmentación transaccional o una prueba de cross selling, o una promoción dirigida, etc.)
1. Objetivo claro y alcanzable a nivel de UN.2. Armar equipo multidisciplinario3. Definir tiempos, tareas, responsabilidades, resultados esperados y métricas de medición.4. Implementar, ACCION!5. Medir los resultados
1.Premisas
CLAVES PARA IMPLEMENTACION DE ESTRATEGIA:
•Ejemplo: Mantener liderazgo•$$$ y/o•# Clientes, cuentas, otros
•Aumentar el Retorno sobre la Inversión (ROI)
1. Premisas:
•Liderazgo ejecutivo•Transmitir eficientemente la Estrategia: mapa•Alinear la organización: Unidades de Negocio, Soporte y Dirección•Motivar a empleados: entrenamiento, educación, otros•Integrar la estrategia al planeamiento y presupuesto2.
Definición de
Estrategia:
•Actividades de distintas Unidades de Negocio, Soporte, DirecciónEjemplo: nuevo canal de ventas. Ventajas?
•Imperativo: nivel corporativo con “Rol Activo” en identificar y coordinar oportunidades3. Sinergía y Alineación:
Aumentar el ROI, satisfaciendo al cliente:
Cómo definimos la “estrategia”?Qué lineamiento deberíamos seguir?
Se definen sobre la base de:1. Aumentar el ROI2. Crear mayor valor a la empresa
Cómo?:Conociendo al Cliente
Con qué herramienta?:Marco de trabajo de 4 perspectivas
NECESITAMOS UN EQUIPO MULTIDISCIPLINARIO Y QUE TRABAJEN ALINEADOS Y SINCRONIZADOS:
PROCESO DE MEJORA CONTÍNUADEL SISTEMA DE GESTIÓN DE CALIDAD
RESPONSABILIDAD DE LA DIRECCIÓN
GESTIÓN DE RECURSOS
MEDIDA, ANÁLISIS Y MEJORA
PRESTACIÓN DEL
SERVICIO
SATISFACCIÓN PARTES
INTERESADAS
SERVICIO
REQUISITOS PARTES
INTERESADAS
5.
Situación ActualTodos los sectores de la
industria
“Las relaciones puedenser manejadas”
Las Tres Dimensiones de la RelaciónSobre estas tres dimensiones es posible trabajar a nivel individual
Duración (en el tiempo)
Profundidad(cantidad de cada prod.)
Alcance(cantidad deproductos)
Existe una relación positiva entre estas tres dimensiones
RetenciónVenta Cruzada
Venta en Profundidad
6.Cómo conocemos profundamente
al Cliente?Con Minería de Datos
¿QUÉ ES MINERIA DE DATOS?
• Es la exploración y análisis de grandes cantidades de datos con el objetivo de descubrir patrones significativos de comportamiento de clientes que están ocultos.
• Cada interacción con el cliente es una oportunidad de aprendizaje. Lo importante es que sea registrado y contar con las herramientas para analizarlo.
Data Warehouse es la memoria de la institución.
Data Mining, su inteligencia.
COMPORTAMIENTOTransacciones
Historia transaccional y tendencias de utilización de los serviciosParticipación en promociones
MI CLIENTE
DESCRIPTIVOSCaracterísticas
Socio y geo demográficos
ACTITUDINALESOpiniones
PreferenciasNecesidades
Deseos
Analítica tiene poder de decisión:
RetenciónCliente
RespuestaCampañas
Tasas deAdquisición
ConversiónOnline
Fraude CrimenGastos Riesgo
7.Automatizamos y
Medimos….
Data Warehouse
Fuentes propias y/o externas
SQL,Oracle,MySQL
Herramienta estadística genera:
2. Procesos de Automatización:
1. Algoritmo del modelo:
Aplicación tecnológica
3. Reportes y listados:
EJEMPLO: TENDENCIA DE VENTAS ($URUG. Y #) DE NUEVAS CUENTAS CORRIENTES EN LA SUCURSAL CORDÓN DURANTE EL MES OCTUBRE 2009 (DÍA A DÍA Y EN COMPARACIÓN CON OCT. 2008):
HASTA AHORA…..:
Mejores decisiones operacionales resultan en aumento del ROI
Modelos Predictivos pueden mejorar las decisiones operacionales
Se necesita:Dar el primer paso........Enfocarse en acciones.......Rápida implementación.......Unidades de Negocio y Sistemas comprometidos(Equipo multidisciplinario)Transmitir la experiencia y motivar.......
Para MARKETING Aumentar significativamente la cantidad y efectividad de Campañas. Mejorar la rentabilidad de acciones focalizadas. Aprovechar oportunidades puestas en evidencia por el comportamiento de sus
Clientes. Producir resultados inmediatos de retención y cross-selling.
Para SISTEMAS Resolver con una solución llave en mano e integrada los requerimientos de la nueva
dinámica de negocio
Para la GESTION Automatizar procesos analíticos aplicando esta información a una herramienta de
Gestión de Marketing Relacional de múltiples indicadores de performance.
Para el NEGOCIO Maximizar el ROI mediante la identificación, retención y crecimiento de los mejores
Clientes.
Aplicaciones de Minería de Datos….hasta ahora nos pueden ayudar en lo siguiente: