portlex: diccionario online modular multilingüe y corpus informatizado anotado de la frase nominal...

1
PROYECTO PORTLEX OBJETIVOS _ MULTIPLICIDAD DE LENGUAS DIVERSIDAD DE TIPOS DE USUARIO CARÁCTER MODULAR y detallada descripción con- trastivo-valencial reversible Atención a la arquitectura online de la información, a la diversa ti- pología de usuario y a los nuevos métodos analíticos en lexicografía Atención al carácter modular del portal en red 3 EJES DESTINATARIOS ACEPCIÓN X GALLEGO ESPAÑOL ITALIANO FRANCÉS ALEMÁN lema tipo de complemento funciones semánticas estructura sintáctica lema tipo de complemento funciones semánticas estructura sintáctica lema tipo de complemento funciones semánticas estructura sintáctica lema tipo de complemento funciones semánticas estructura sintáctica lema tipo de complemento funciones semánticas estructura sintáctica ESTRUCTURA MODULAR La metodología aplicada en el proyecto CSVEA sirve de punto de partida para PortLex. Se basa, por un lado, en la gramática y lexicografía de valencias y, por otro, en el análisis de amplios corpora. Así, toda realización de cada uno de los actantes queda documentada a través de ejemplos reales y contextualizados tomados del corpus como el CREA para el español, el FranText para el francés y del COSMAS y el Taz-Corpus para el alemán. En esta línea, adoptamos las propuestas de Engel (2009), Zifonun et al. (1997) y Schierholz (2001). D ELABORACIÓN DE UN CORPUS MULTILINGÜE anotado – español, alemán, gallego, italiano y francés- y de un portal lexicográfico online, modular, rever- sible y multilingüe, metodológica- mente sustentados en la gramática y lexicografía valencial y en la lingüística de corpus DESARROLLO DE DICCIONARIOS MONOLINGÜES Y CONTRASTIVOS reversibles y online para las dif- rentes lenguas abordadas en el estudio INNOVACIÓN EN LA INVESTIGACIÓN sobre tipología de usuario y arquitectura de la información y desarrollo de métodos empíricos para el estudio del uso del diccionario. INVESTIGADORES Pueden trabajar con los diferentes módulos y datos del diccionario ESTUDIANTES DE UNA LENGUA EXTRANJERA Pueden estar interesados únicamente en el apartado contrastivo del diccionario. DOCENTES Pueden usar esta obra como manual de consulta PARTIR DE UN DICCIONARIO MADRE ARQUITECTURA DE LA ENTRADA ENTRADA EQUIVALENCIA INFORMACIÓN MORFOLÓGICA INFORMACIÓN SINTÁCTICA INFORMACIÓN SEMÁNTICA TEST DE DELIMITACIÓN DE ARGUMENTOS EJEMPLOS COMENTARIOS Definición de cada acepción Definición de cada actante (en base a paráfrasisde los roles semánticos) Significado categorial Sinónimos Fijación de equivalentes Cuestiones contrastivas Ejemplos de Corpus (CREA, COSMAS, Frantext, Taz-Corpus) Ejemplos acortados Ejemplos basados en competencia lingüística Caso Tipo de realización Modelo estándar Tipo de complemento Combinatoria actancial y serialización Combinatoria con otras clases de palabras Diferenciación entre actantes específicos y aespecíficos Clasificación de actantes específicos f VENTAJAS / PROBLEMAS PROBLEMAS Equivalencia no plena. Peso concedido al diccionario madre y su influencia sobre las demás obras de consulta. Dificultades de interconexión de datos entre las lenguas que no son el eje de partida, esto es, el español. Depuración de los resultados en los diccionarios que no son madre, VENTAJAS Optimizar datos construyendo varios diccionarios desde el español. Interconectar los resultados de las diferentes lenguas. Responder a las necesidades de diferentes tipos de usuarios. MINECO (FFI2012-32456) RELEX (CN2012/290) MARÍA JOSÉ DOMÍNGUEZ VÁZQUEZ (IP) MÓNICA MIRAZO BALSA CARLOS VALCÁRCEL RIVEIRO (Uvigo) PORTLEX PORTAL LEXICOGRÁFICO: DICCIONARIO ONLINE MODULAR MULTILINGÜE Y CORPUS INFORMATIZADO ANOTADO DE LA FRASE NOMINAL RETO INVESTIGADORA PRINCIPAL MARÍA JOSÉ DOMÍNGUEZ VÁZQUEZ (USC) EQUIPO DE INVESTIGACIÓN Universidade de Santiago de Compostela Universität Nürnberg-Erlangen Institut für Deutsche Sprache, Mannheim Universidad de Sevilla Universidade da Coruña Universidad de Vigo Universität Leipzig investigadores de universidades y centros de investigación de España y Alemania: n 14 FINANCIACIÓN MINISTERIO DE ECONOMÍA Y COMPETITIVIDAD DURACIÓN 3 AÑOS Concesión provisional: 01/02/2013 Código: FFI2012-32456 csvea: embrión de portlex diccionario madre DICCIONARIO ESPAÑOL DICCIONARIO ESPAÑOL DICCIONARIO ITALIANO DICCIONARIO ALEMÁN DICCIONARIO GALEGO DICCIONARIO FRANCÉS DICCIONARIO ALEMÁN DICCIONARIO ESPAÑOL Crear una base de datos relacional multiidioma bidireccional que nos permita inlcuir el análisis de sustantivos de cada una de las lenguas. Para cada una de las lenguas sería necesario crear diferentes tablas de datos que estarían ligados para hacer posible cualquier búsqueda entre cualquier par de lenguas, siendo el nexo de unión entre todas las lenguas, la ACEPCIÓN (es la información que permanece invariable en cada lengua) LA ACEPCIÓN COMO NEXO DE UNIÓN El problema radica aquí en el hecho de que si una acepción no está recogida en el diccionario madre nunca llegaremos a ella desde el español y, probablemente, no se procederá a su descripción.Teniendo en cuenta que estamos construyendo diccionarios reversibles con autonomía propia, la aparición de lagunas interlingüísticas en las fases iniciales del trabajo será, pues, inevitable. ¿Cómo solucionar este problema? MÁS ALLÁ DEL DICCIONARIO MADRE CSVA BILINGÜE + BIDIRECCIONAL PORTLEX MULTILINGÜE + MULTIDIRECCIONAL BASE DE DATOS Para crear una herramienta lexicográfica multifuncional partimos del diccionario español CSVEA para crear un diccionario madre en torno al cual se construyen los diferentes módulos de la base de datos. De esta forma, a partir de una sola base de datos se crean varios diccionarios para que los usuarios puedan realizar búsquedas monolingües, bilingües o multilingües en función de sus necesidades. multiidioma y bidireccional multimodular etiquetado sintáctico-semántico multifuncional DIVERSIDAD DE DICCIONARIOS UNA SOLA BASE DE DATOS monolingües bilingües multulingües METODOLOGÍA

Upload: carlos-valcarcel

Post on 26-Oct-2015

186 views

Category:

Documents


1 download

DESCRIPTION

Póster sobre o projeto PortLex apresentado no 1º Simpósio Internacional RELEX "Lexicografía románica. Estado da cuestión" (A Coruña, 15-17 de outubro de 2013).

TRANSCRIPT

Page 1: Portlex: Diccionario online modular multilingüe y corpus informatizado anotado de la frase nominal (Póster)

PROYECTO PORTLEX OBJETIVOS

_MULTIPLICIDAD DE LENGUAS DIVERSIDAD DE TIPOS DE USUARIO CARÁCTER MODULARy detallada descripción con-trastivo-valencial reversible

Atención a la arquitectura online de la información, a la diversa ti-pología de usuario y a los nuevos métodos analíticos en lexicografía

Atención al carácter modular del portal en red

3 EJES DESTINATARIOS

ACEPCIÓN X

GALLEGO

ESPAÑOL

ITALIANO

FRANCÉS

ALEMÁN

lema

tipo de complemento

funciones semánticas

estructura sintáctica

lema

tipo de complemento

funciones semánticas

estructura sintáctica

lema

tipo de complemento

funciones semánticas

estructura sintáctica

lema

tipo de complemento

funciones semánticas

estructura sintáctica

lema

tipo de complemento

funciones semánticas

estructura sintáctica

ESTRUCTURAMODULAR

La metodología aplicada en el proyecto CSVEA sirve de punto de partida para PortLex. Se basa, por un lado, en la gramática y lexicografía de valencias y, por otro, en el análisis de amplios corpora. Así, toda realización de cada uno de los actantes queda documentada a través de ejemplos reales y contextualizados tomados del corpus como el CREA para el español, el FranText para el francés y del COSMAS y el Taz-Corpus para el alemán. En esta línea, adoptamos las propuestas de Engel (2009), Zifonun et al. (1997) y Schierholz (2001).

DELABORACIÓN DE UN

CORPUS MULTILINGÜEanotado – español, alemán, gallego, italiano y francés- y de un portal lexicográfico online, modular, rever-sible y multilingüe, metodológica-mente sustentados en la gramática y lexicografía valencial y en la lingüística de corpus

DESARROLLO DE DICCIONARIOSMONOLINGÜES Y CONTRASTIVOS

reversibles y online para las dif-rentes lenguas abordadas en el estudio

INNOVACIÓN ENLA INVESTIGACIÓN

sobre tipología de usuario y arquitectura de la información y desarrollo de métodos empíricos para el estudio del uso deldiccionario.

INVESTIGADORESPueden trabajar con los diferentesmódulos y datos del diccionario

ESTUDIANTES DE UNALENGUA EXTRANJERA

Pueden estar interesados únicamente en el apartado contrastivo del diccionario.

DOCENTESPueden usar esta obra como manual de consulta

PARTIR DE UN DICCIONARIO MADRE

ARQUITECTURA DE LA ENTRADA

ENTRADA

EQUIVALENCIA

INFORMACIÓN MORFOLÓGICA

INFORMACIÓN SINTÁCTICA INFORMACIÓN SEMÁNTICA

TEST DE DELIMITACIÓNDE ARGUMENTOS

EJEMPLOS

COMENTARIOS

Definición de cada acepción

Definición de cada actante

(en base a paráfrasisde los roles semánticos)

Significado categorialSinónimos

Fijación de equivalentesCuestiones contrastivas

Ejemplos de Corpus (CREA, COSMAS, Frantext, Taz-Corpus)Ejemplos acortadosEjemplos basados en competencia lingüística

CasoTipo de realización

Modelo estándarTipo de complemento

Combinatoria actancial y serializaciónCombinatoria con otras clases de palabras

Diferenciación entre actantes específicos y aespecíficosClasificación de actantes específicos

f

VENTAJAS / PROBLEMAS

PROBLEMAS

Equivalencia no plena.

Peso concedido al diccionario madre y su influencia sobre las demás obras

de consulta.

Dificultades de interconexión de datosentre las lenguas que no son el eje de

partida, esto es, el español.

Depuración de los resultados en losdiccionarios que no son madre,

VENTAJAS

Optimizar datos construyendo varios diccionarios desde el español.

Interconectar los resultadosde las diferentes lenguas.

Responder a las necesidadesde diferentes tipos de usuarios.

MINECO (FFI2012-32456)RELEX (CN2012/290)

MARÍA JOSÉ DOMÍNGUEZ VÁZQUEZ (IP)MÓNICA MIRAZO BALSACARLOS VALCÁRCEL RIVEIRO (Uvigo)

PORTLEXPORTAL LEXICOGRÁFICO:

DICCIONARIO ONLINE MODULAR MULTILINGÜE

Y CORPUS INFORMATIZADO ANOTADO

DE LA FRASE NOMINAL

RETO

INVESTIGADORA PRINCIPAL

MARÍA JOSÉ DOMÍNGUEZ VÁZQUEZ (USC)

EQUIPO DE INVESTIGACIÓN

Universidade de Santiago de CompostelaUniversität Nürnberg-Erlangen

Institut für Deutsche Sprache, MannheimUniversidad de Sevilla

Universidade da Coruña Universidad de VigoUniversität Leipzig

investigadores de universidades y centros de investigación de España y Alemania: n14

FINANCIACIÓN

MINISTERIO DE ECONOMÍA Y COMPETITIVIDAD

DURACIÓN

3 AÑOSConcesión provisional:01/02/2013 Código: FFI2012-32456

csvea: embrión de portlex

diccionario madre

DICCIONARIO ESPAÑOL

DICCIONARIO ESPAÑOL

DICCIONARIO ITALIANO

DICCIONARIO ALEMÁN

DICCIONARIO GALEGO

DICCIONARIO FRANCÉS

DICCIONARIO ALEMÁN

DICCIONARIO ESPAÑOL

Crear una base de datos relacional multiidioma bidireccional que nos permita inlcuir el análisis de sustantivos de cada una de las lenguas. Para cada una de las lenguas sería necesario crear diferentes tablas de datos que estarían ligados para hacer posible cualquier búsqueda entre cualquier par de lenguas, siendo el nexo de unión entre todas las lenguas, la ACEPCIÓN (es la información que permanece invariable en cada lengua)

LA ACEPCIÓN COMO NEXO DE UNIÓN

El problema radica aquí en el hecho de que si una acepción no está recogida en el diccionario madre nunca llegaremos a ella desde el español y, probablemente, no se procederá a su descripción.Teniendo en cuenta que estamos construyendo diccionarios reversibles con autonomía propia, la aparición de lagunas interlingüísticas en las fases iniciales del trabajo será, pues, inevitable. ¿Cómo solucionar este problema?

MÁS ALLÁ DEL DICCIONARIO MADRE

CSVABILINGÜE + BIDIRECCIONAL

PORTLEXMULTILINGÜE + MULTIDIRECCIONAL

BASE DE DATOSPara crear una herramienta lexicográfica multifuncional partimos del diccionario español CSVEA para crear un diccionario madre en torno al cual se construyen los diferentes módulos de la base de datos. De esta forma, a partir de una sola base de datos se crean varios diccionarios para que los usuarios puedan realizar búsquedas monolingües, bilingües o multilingües en función de sus necesidades.

multiidiomay bidireccional

multimodular

etiquetadosintáctico-semántico

multifuncional

DIVERSIDAD DE DICCIONARIOS

UNA SOLA BASE DE DATOS

monolingües

bilingües

multulingües

METODOLOGÍA