multiplica la exactitud de tu analítica de texto - meaningcloud webinar

Post on 12-Aug-2015

348 Views

Category:

Data & Analytics

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

La analítica de textos más precisa con MeaningCloud

Multiplica la exactitud de tu analítica de texto con nuestras herramientas de personalización

Webinar Daedalus / MeaningCloud, 12 de mayo de 2015

Introducción

Presentador

Logística

Enviar preguntas de texto

“Levantar la mano” para hablar

Publicaremos enlace a webinar grabado

Antonio Matarranz

Director Comercial

Agenda

Analítica de texto. Exactitud, precisión y cobertura

Recursos lingüísticos personalizados para mejorar la exactitud

Herramientas de personalización de MeaningCloud

Conclusiones y preguntas

Analítica de texto

Extraer significado “actuable” de contenido no estructurado Automatización de tareas típicamente manuales

OpinionesTemasHechos

Conceptos

Organizaciones

Personas

Análisis

Semántico

Relaciones

¿Qué precisión tiene todo esto?

La precisión es “relativa”

Las personas no tenemos una precisión del 100%

Tests con analistas humanos: acuerdo 85-95%

Además de precisión, cobertura (recall)

Alta precisión Alta cobertura

Alta precisión Baja cobertura

Baja precisión Alta cobertura

Identificado por algoritmo

Exactitud: precisión y cobertura

Precisión y cobertura están inversamente relacionadas

Buscar compromiso

Los requisitos dependen de la aplicación

Monitorización de marca en medios sociales: alta precisión, baja cobertura

Lucha antiterrorista: alta cobertura, baja precisión

Estado del arte en analítica de texto

Medidas de precisión

Extracción de topics (ej.: entidades): 70-85%

Clasificación: 70-80%

Análisis de sentimiento: 60-70%

La mejora de calidad depende de la adaptación de las herramientas y recursos a la aplicación/tarea

MeaningCloud: API semánticas en la nube

Regístrate y úsalo GRATIS en http://www.meaningcloud.com

APIs MeaningCloud Análisis de sentimiento Global A nivel de aspecto

Clasificación Modelos estándar

Extracción de topics Entidades Conceptos Fechas Direcciones Cantidades económicas Expresiones temporales …

https://www.meaningcloud.com/es/demos/analisis-de-medios/

MeaningCloud: recursos estándar

Ontodaedalus (ontología) 437 tipos de entrada

78 temáticos

250.000+ lemas/idioma

https://www.meaningcloud.com/developer/documentation/ontodaedalus

MeaningCloud: recursos estándar

Modelos de clasificación estándar

IPTC: noticias

Business Reputation: reputación corporativa

EuroVoc: administración pública

IAB (pronto): publicidad

https://www.meaningcloud.com/developer/resources/models

Un ejemplo práctico

Recorrido por las herramientas de personalización de MeaningCloud

Escenario VoC / Customer Insights

Redes sociales, foros

Verbatims encuestas

Interacciones Contact Center: voz, email…

Estructurar y extraer significado

¿Qué empresas/ marcas mencionan?

¿De qué están hablando?

¿Cuál es su opinión?

Análisis

Insights

Opiniones

La frase “¡Tiene el tipo de interés más alto del mercado!” es…

Positiva, si habla de depósitos

Negativa, si habla de hipotecas

Recursos lingüísticos específicos mejoran la exactitud

Menciones

Nombres de bancos y entidades financieras, p. ej.: Santander, BBVA

Nombres de productos, p. ej.: Cuenta Naranja, Libreta Estrella…

Temas

Ejemplo: análisis de las opiniones de clientes de un banco

Productos

Pasivo

Cuenta

Depósito

Activo

Crédito

Hipoteca

Canal

Oficina

Teléfono

Internet

Qué vamos a hacer

Diccionario Banca

Nombres de bancos, nombres de productos (entidades)

Nombres de productos genéricos, p.ej.: hipoteca (conceptos)

Modelos de clasificación

Modelo Canales: teléfono, web…

Modelos de sentimiento (avance)

Herramientas de personalización MeaningCloud

Diccionarios personales

Creando un nuevo diccionario

Posibilidad de importar diccionario desde fichero

Creando una nueva entidad

Alias: NO es necesario introducir explícitamente alias “inmediatos”( ej.: tildes), motor genera variantes

Usa tu propia ontología

Posible incorporar información semántica adicional

Diccionario resultante

Entidades

Conceptos

La ontología que se deriva del diccionario

Importación de diccionarios

La mejor manera de incorporar a MeaningCloud un diccionario preexistente

Forma Alias ID Atributos de Información semántica

Resultado: las APIs identifican topics del diccionario

Identifica información semántica Producto: Cuenta Nómina Tipo: Cuenta corriente Banco: ING

Modelos de clasificación personales

Creando un nuevo modelo

Posibilidad de importar modelo desde fichero

Definiendo una categoría: enfoque híbrido

Basado en Reglas

Basado en Entrenamiento

Se puede optar por uno de los enfoques o combinarlos,

según la aplicación

Definiendo una categoría: entrenamiento

Se alimenta con textos de entrenamiento precodificados

Basado en tecnología machine learning

Definiendo una categoría: reglas

Términos que

Aumentan la relevancia

Disminuyen la relevancia

Son imprescindibles

Están prohibidos

Cómo mejorar precisión y cobertura aplicando reglas + entrenamiento

Estadístico Basado en reglas Híbrido

Ventajas Muy rápido si ya tienes

textos etiquetados

Buenos resultados para

textos largos

No hay falsos positivos

Muy buenos

resultados para

casuísticas limitadas

Se puede poner en marcha

fácilmente a partir de textos

de ejemplo

No necesita definición

exhaustiva de reglas

Desventajas “Caja negra”

Falsos positivos difíciles

de corregir

Sesgo en resultados

según entrenamiento

Costoso partiendo

desde cero

Falsos negativos según

la calidad de las reglas

Escala con dificultades

Requiere conocimiento

exhaustivo de dominio

Modelo resultante

Importación de modelos

La mejor manera de incorporar a MeaningCloud un modelo

preexistente

Resultado: las APIs clasifican según el modelo

Justifica la relevancia de la clasificación en función de los términos que parecen

Aplicación al Análisis de Sentimiento

Sentimiento: uso de diccionarios personales de entidades y conceptos

Polaridad asociada a la entidad Cuenta Nómina

Diccionarios personalizados de Sentimiento (PRONTO)

No todos los términos tienen la misma polaridad en todos los dominios

Ej.: en el dominio de artículos de lujo “barato” no tiene necesariamente una polaridad positiva (como en otros dominios)

En modelo de Sentimiento para dominio Lujo: “barato” N

Un mismo término puede tener distintas polaridades, según el contexto

Tenemos esta funcionalidad en pruebas. Si quieres participar en la beta privada envía un email a support@meaningcloud.com

Término Contexto Polaridad

cerrar Bolsa, marcador NEUTRO

cerrar Contrato, compraventa P

cerrar Empresa N

Conclusiones

¿Cómo mejorar la exactitud?

Herramientas gráficas

Posibilidad de incorporar tus diccionarios y modelos

Amplia cobertura: menciones, temas, opiniones…

Usuarios autónomos

La mayor exactitud al alcance de tu mano

Democratizando la extracción de significado

Análisis semántico de alta calidad

Combinación optimizada de tecnologías

Recursos semánticos actualizados continuamente

APIs de alto nivel, ej.: reputación corporativa…

Personalización al dominio del cliente: clasificación, diccionarios, sentimiento

Asequible y sin riesgos

Tecnología madura y probada

Posible probar y usar Gratis (40.000 peticiones/mes)

Pago por uso

Sin compromisos ni permanencias

Planes comerciales a partir de 99 $/mes

Para desarrolladores y

usuarios no técnicos

Add-in para Excel

APIs servicios web estándar

Plug-ins y SDKs para diversos entornos y lenguajes

Plug-and-play

OpinionesTemasHechos

Conceptos

Organizaciones

Personas

Relaciones

¡Muchas gracias por vuestra atención!

Preguntas, sugerencias, etc.

Antonio Matarranz

Director Comercial

amatarranz@daedalus.es

Daedalus, S.A.

Tel: +34 913324301

http://www.meaningcloud.com

http://www.daedalus.es

top related