generación de resúmenes mediante grafos conceptuales
Post on 14-Apr-2017
57 Views
Preview:
TRANSCRIPT
UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA
FACULTAD DE CIENCIAS DE LA EDUCACIÓN
Generación de resúmenes por medio de síntesis de grafos conceptuales
PRESENTADO POR:DENIS GUSTAVO, NINA ARANA
CURSO:
DIDÁCTICA DE LA INFORMÁTICASÉPTIMO SEMESTRE
Generación de resúmenes abstractivos de un solo documento,
basado en la representación
conceptual del texto.
PROPONE LA INVESTIGACIÓN:
RESUMEN
Modelo que usa una
representación semántica
completa del texto
Resume el conjunto de los grafos conceptuales correspondientes.
Se aplicará un conjunto de
operaciones sobre los grafos
1
23
Resumen del texto a nivel conceptual
GENERACIÓN AUTOMÁTICA DE RESÚMENES
Generación de resúmenes por medio de síntesis de grafos conceptuales
La generación automática de resúmenes son capaces de presentar la información de manera concisa
Extraer la información más importante de una fuente para producir una versión abreviada
Se pueden considerar dos grandes grupos de sistemas que generan resúmenes automáticamente
GENERACIÓN AUTOMÁTICA DE RESÚMENES
Generación de resúmenes por medio de síntesis de grafos conceptuales
Selección de oraciones consideradas sobresalientes en
el texto de origen
RESUMEN EXTRACTIVO RESUMEN EXTRACTIVO
Se crean regenerando el contenido extraído del texto
fuente
Utilizan métodos lingüísticos, que permiten describir mejor al
documento.
Divide el texto en fragmentos y selecciona los más importantes
GRAFOS CONCEPTUALES
Generación de resúmenes por medio de síntesis de grafos conceptuales
SOWA (1984) Son estructuras para la representación del conocimiento basados en lógica
EXISTEN DOS TIPOS DE NODOS:
Un concepto se conecta a otro concepto a través de una relación conceptual, y una relación conceptual debe conectarse estrictamente con algún concepto.
Las relaciones conceptuales
Los conceptos
REDES SEMÁNTICAS Son sistemas de organización del
conocimiento que estructuran los
conceptos
FORMA -DISPLAY FORM- (DF)
1
2
Grafo conceptual con 4 conceptos [Go], [Person: John], [City: Boston], y [Bus]. Éste tiene 3 relaciones conceptuales: (Agnt) se refiere [Go] al agente John, (Dest)se refiere [Go] al destino Boston, e (Inst) se refiere [Go] al instrumento bus. Desde el concepto [Go] se agregan 3 relaciones conceptuales, la formal lineal no puede dibujarse en una línea recta, como en el primer ejemplo. En cambio, un guión al final de la primer línea indica que las relaciones adjuntas a [Go] se continúan en líneas subsecuentes.
Generación de resúmenes basado en grafos conceptuales (GCs).
Durante el proceso de generación, se agrega información semántica y
sintáctica de fuentes externas.
En la etapa de síntesis, los grafos se reducen de acuerdo a un conjunto
de operaciones
Generar los GCs a partir de un conjunto de
documentos seleccionados.
HERRAMIENTASEl enfoque investigado se basa en el formalismo de GCs, la cual requiere información adicional que es añadido a los grafos en su elaboración
WordNet
RECURSOS LINGÜÍSTICOS
Es una base de datos léxica agrupada en sustantivos, verbos, adjetivos y adverbios.
VerbNetEs un diccionario computacional que contiene información sintáctica y semántica de verbos para el inglés.
coherencia de las oraciones
Almacena relaciones semánticas entre conj. De
sinónimos
PROPONE LA INVESTIGACIÓN:
Poda
GeneralizaciónAsociación
Ponderación
Síntesis de grafos conceptuales
Generación de grafos conceptuales
Generación de resúmenes por medio de síntesis de grafos conceptuales
1
2
La regla de transformación básica es que palabras tales como sustantivos, verbos, adjetivos y adverbios, CORRESPONDEN NODOS CONCEPTO, y las palabras funcionales tales como las preposiciones, conjunciones y verbos auxiliares,corresponden a NODOS RELACIÓN
Generalización
Síntesis de grafos conceptuales
Generación de resúmenes por medio de síntesis de grafos conceptuales
Combina dos GCs de acuerdo a sus elementos comunes.
G1Pedro compra un perro
G2María compra un grato
G3Dos personas compran dos animales
Síntesis de grafos conceptuales
Generación de resúmenes por medio de síntesis de grafos conceptuales
PonderaciónLa operación de ponderación filtra los nodos más importantes del grafo. Para determinar la importancia de los nodos, se utiliza el algoritmo
HITSGrado de entrada y el grado de salida del nodo para determinar su
importancia.
AUTH y HUB
Métricas
para determinar la importancia del nodo
que dice cuán buena es la información
Síntesis de grafos conceptuales
Generación de resúmenes por medio de síntesis de grafos conceptuales
Esta operación toma en cuenta los resultados de la ponderación, los patrones verbales para remover los nodos irrelevantes y la tasa de compresión para establecer cuántos nodos deben incluirse en el resumen resultante. Esta operación selecciona los nodos según su valor de la métrica AUTH
Poda
RESULTADOS
Hovy (2005) un resumen es útil si se encuentra entre el 15% y el 35% de longitud con respecto al documento original.
Los experimentos se realizaron con la colección de noticias de la competencia DUC 2003.Documentos con longitud de entre 50 y 100 palabras. Se definieron tres grupos de documentos según su longitud: 3 oraciones (Grupo I), 4 oraciones (Grupo II) y más de 4 oraciones (Grupo III). Cada grupo consta de 10 documentos representados como GCs.
top related