evitando el fraude a través de la presentación de la información en grafos
Upload: universidad-de-deusto-deustuko-unibertsitatea-university-of-deusto
Post on 11-Apr-2017
2.441 views
TRANSCRIPT
Evitando el fraude a través de la REpresentación de la información en grafos
Dr. Jesús Barrasa Univ. Deusto, 27 Oct 2015
Aclaración: esto no son grafos.
Qué es un grafo?
Vértice
Arco
Análisis de la “popularidad” de los diferentes tipos de bases de datos (db-engines.com)
El origen: Teoría de grafos
Con ustedes… Leonhard Euler
• Matemático suizo • Inventor de la teoría
de grafos (1736)
Königsberg (Prusia) - 1736
A
B
D
C
A
B
D
C
1
23
4
7
65
El modelo ‘Labeled Property Graph’
Redes sociales
Análisis de impacto en redes de telecomunicaciones
Sistemas de recomendación
Logística
Detección y prevención de fraude
Qué ha pasado hasta ahora? Límites del enfoque relacional• Introduce complejidad al modelizar
relaciones • Degradación del rendimiento al
aumentar el numero de asociaciones, y con el volumen de datos
• Complejidad de las consultas crece necesidad de JOINs
• Introducir nuevos tipos de datos y asociaciones requieres rediseño del esquema, migración, coste
… hacen a las RDB inadecuadas cuando las asociaciones entre puntos de datos son valiosas en tiempo real
Desarrollo lento Rendimiento pobre
Problemas escalabilidadCoste de mantenimiento
NoSQL al rescate, pero que pasa con las asociaciones?• No ofrecen estructuras de datos
para modelizar o almacenar relaciones
• Los lenguajes de consultas no incluyen elementos para consultarlas
• La logica de association de datos vive en la capa de aplicación
• No transaccionales (ACID)
… hacen a estas tres categorías NoSQL inadecuadas cuando las asociaciones entre puntos de datos son valiosas en tiempo real
El cruce de caminos
El modelo conceptual es el modelo físico
Fraude: First-Party
• Objetivo de los defraudadores? Solicitar lineas de credito, actuar de forma aparentemente normal, extender el credito… y desaparecer!
• Creación de identidades sintéticas
• Caso poco mediatizado, ya que solo los bancos se ven afectados. • En el caso de 3rd party se da una suplantación de personalidad y el
afectado es una tercera persona.
Tamaño del problema
• Decenas de miles de millones de $ son defraudados al año solo a bancos estadounidenses
• 25% del total de créditos personales amortizados como perdidas
Anillo de fraude
Hasta donde llega el análisis discreto?
…la reacción no es sencilla
• Cuando el fraude es detectado, qué se debe cancelar? • Cómo hacerlo mas rápido que los defraudadores para minimizar
pérdidas? Es posible prevenirlo?
• Modelizando los datos como grafos
La gente comparte piso… y es normal
La gente comparte piso… y es normal
MATCH (p1:AccountHolder)-[:HAS_ADDRESS]->(a)<- [:HAS_ADDRESS]-(p2:AccountHolder) WHERE p1 <> p2 RETURN p1,p2,a
Cadena sospechosa
Cadena sospechosa
MATCH p = (a1:AccountHolder)-[r1:HAS_ADDRESS|:HAS_PHONENUMBER*8]-(a2:AccountHolder) WHERE a1 <> a2 return p
Bloqueo de tarjetas
MATCH p = (a1:AccountHolder)-[r1:HAS_ADDRESS|:HAS_PHONENUMBER*8]-(a2:AccountHolder) WHERE a1 <> a2 WITH nodes(p) as fraudsterList limit 1 UNWIND fraudsterList AS fraudster MATCH fraudster-[:HAS_CREDITCARD]->(cc) return fraudster.fullName, fraudster.UniqueId, cc.accountNumber
Neo Technology Overview
Product • Neo4j - World’s leading graph database
• 1M+ downloads, adding 50k+ per month
• 14 years of R&D
Company • Neo Technology, Inc., founded 2007
• 110 employees with HQ in Silicon Valley; offices in London, Munich, Paris and Malmö
• 160+ enterprise subscription customers including 60+ G2k companies
• 20,000+ education registrants
• 18,000+ Meetup members
• 100+ technology and service partners
• $45M in funding from Fidelity, Sunstone, Conor, Creandum, Dawn Capital
Customers & Partners • Retail: Walmart, Target, Adidas, eBay
• Telco: Telenor, Tre, AT&T, Deutsche Telecom
• Financial Services: UBS, JP Morgan, RBC, ICE
• Partners: Accenture, McKinsey, BCG
May 14 2015