incorporación de adjetivos al wordnet español

16
Incorporación de Incorporación de Adjetivos al WordNet Adjetivos al WordNet Español Español Anselmo Peñas, Irina Chugur, Julio Gonzalo y Felisa Verdejo UNED

Upload: quintessa-duran

Post on 04-Jan-2016

54 views

Category:

Documents


2 download

DESCRIPTION

Incorporación de Adjetivos al WordNet Español. Anselmo Peñas, Irina Chugur, Julio Gonzalo y Felisa Verdejo UNED. Índice. Introducción Enlace de adjetivos a nombres y verbos del español Enlace de adjetivos al Índice InterLingua (ILI) de EuroWordNet Conclusiones. Synset. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Incorporación de Adjetivos al WordNet Español

Incorporación de Adjetivos al Incorporación de Adjetivos al WordNet EspañolWordNet Español

Anselmo Peñas, Irina Chugur,

Julio Gonzalo y Felisa Verdejo

UNED

Page 2: Incorporación de Adjetivos al WordNet Español

ÍndiceÍndice

Introducción Enlace de adjetivos a nombres y verbos

del español Enlace de adjetivos al Índice InterLingua

(ILI) de EuroWordNet Conclusiones

Page 3: Incorporación de Adjetivos al WordNet Español

Introducción: EuroWordNetIntroducción: EuroWordNet

EuroWordNet base de datos léxica multilingüe

en ocho idiomas europeos

Redes Semánticas formadas por synsets

Un synset es un conjunto de sinónimos

correspondientes a un concepto lexicalizado

Relaciones semánticas entre synsets:

hiponimia, meronimia, implicatura, etc.

Índice InterLingua (ILI) superconjunto de los

conceptos que aparecen en los distintos

wordnets

Synset

Page 4: Incorporación de Adjetivos al WordNet Español

Introducción: Objetivos del TrabajoIntroducción: Objetivos del Trabajo

Introducir synsets adjetivales en el WN español• de forma automática• metodología consistente con la construcción de

synsets nominales y verbales enlazar palabras del español con los synsets de WordNet 1.5 (Miller et al. 1990)

– enlaces con nombres y verbos del español– enlaces al Índice InterLingua

Page 5: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos a nombres y Enlace de adjetivos a nombres y verbos del español (I)verbos del español (I)

Identificación de relaciones– Definiciones del diccionario• Sinonímicas “censurable: reprobable”

relación de sinonimia• Antonímicas “irreal: no real”

relación de antonimia• Analíticas “dubitativo: que implica duda”

relación adjetivo - nombre/verbo

– Uso de patrones y criterios morfológicos

Page 6: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos a nombres y Enlace de adjetivos a nombres y verbos del español (II)verbos del español (II)

Selección de 3580 adjetivos (selección de seis sufijos productivos)

Enlaces

Adjetivos 47.23% 16.51% 9.27%

3325911691

4.47%

160

SinónimosA nombresA verbos Antónimos

Page 7: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de EWNEnlace de adjetivos al ILI de EWN

Recursos Adjetivos del inglés ya enlazados al ILI (Synsets de WordNet 1.5) Diccionarios bilingües en formato electrónico (inglés-español,

español-inglés)

00226642

ILI

Synset español

{baldado, deshecho, destrozado}

Synset inglés

{shattered, smashed, splintered}

Heurísticas Traducción al español de

adjetivos ingleses (2) Traducción al inglés de

adjetivos españoles (4)

Page 8: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de EWNEnlace de adjetivos al ILI de EWN

Traducción al español de adjetivos ingleses• Traducción de adjetivos ingleses monosémicos

damp

019354444

Monosémico según WN

húmedo

mojado

Traducciones

Page 9: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de EWNEnlace de adjetivos al ILI de EWN

Traducción al español de adjetivos ingleses • Traducción al español de las variantes de

un synset inglés

Synset inglés{gruff hoarse husky}

00235058Traducciones

bronco

rudo

malhumorado

áspero

ronco

ronco

Co-ocurrencia

ronco

Page 10: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de Enlace de adjetivos al ILI de EWNEWN

Traducción al inglés de adjetivos españoles• Traducción al inglés única y monosémica

00125050Monosémico según WNabochornado ashamed

Traducción única

Page 11: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de Enlace de adjetivos al ILI de EWNEWN

Traducción al inglés de adjetivos españoles• Traducción al inglés única y polisémica

premeditado

deliberate

Traducción única 01016975 deliberate intentional knowing willful wilful

00965893 careful deliberate measured

01834448 deliberate

01407902 Calculated deliberate measured

[Ocurrencias de adj en las traducciones inversas de las variantes de syn ]2

h_r (adj, syn)=Número de traducciones inversas

X h_r= 0.25 < 0.3

h_r= 0.5 > 0.3

h_r= 0.5 > 0.3

Traducciones inversas h_r= 0.67 > 0.3

Page 12: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de Enlace de adjetivos al ILI de EWNEWN

Traducción al inglés de adjetivos españoles• Traducción al inglés múltiple, algunas

traducciones monosémicas

chillón

screaming

loud

garish

00235682Monosémico según WN

01818583Monosémico según WN

......

...

Page 13: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de Enlace de adjetivos al ILI de EWNEWN

Traducción al inglés de adjetivos españoles• Traducción al inglés múltiple con synsets

en común

encharcado

flooded

swamped

00817914

00816602

00064913

01398176

Page 14: Incorporación de Adjetivos al WordNet Español

Enlace de adjetivos al ILI de EWNEnlace de adjetivos al ILI de EWN

3102 adjetivos enlazados (dic. español-inglés tiene 3741) 5237 enlaces y 3424 synsets 1.53 variantes por synset Revisión manual de muestras significativas

Resultados Enlacesadjetivo/ synset

Número deadjetivos

Número desynsets

Traducción de adjetivosingleses monosémicos 1768 1470 1199

raducción de las variantes deun synset inglés 871 551 676

Traducción única ymonosémica al inglés 592 592 530

raducción única y polisémicaal inglés 1271 474 1209

Traducción múltiple al inglés,algunas trad. monosémicas 1166 931 730

Traducción múltiple al ingléscon synsets en común 606 361 415

Datos globales 5237 3102 3424

Page 15: Incorporación de Adjetivos al WordNet Español

ConclusionesConclusiones

Incorporación de adjetivos españoles a EWN Heurísticas para enlazar adjetivos, válidas

para otras categorías Dos aproximaciones:– Diccionario monolingüe:• apropiada para relaciones entre categorías,• dificultad para enlazar nuevos synsets a WN

– Diccionarios bilingües:• apropiada para enlazar palabras a un WN

Page 16: Incorporación de Adjetivos al WordNet Español