portlex: diccionario online modular multilingüe y corpus informatizado anotado de la frase nominal...
DESCRIPTION
Póster sobre o projeto PortLex apresentado no 1º Simpósio Internacional RELEX "Lexicografía románica. Estado da cuestión" (A Coruña, 15-17 de outubro de 2013).TRANSCRIPT
PROYECTO PORTLEX OBJETIVOS
_MULTIPLICIDAD DE LENGUAS DIVERSIDAD DE TIPOS DE USUARIO CARÁCTER MODULARy detallada descripción con-trastivo-valencial reversible
Atención a la arquitectura online de la información, a la diversa ti-pología de usuario y a los nuevos métodos analíticos en lexicografía
Atención al carácter modular del portal en red
3 EJES DESTINATARIOS
ACEPCIÓN X
GALLEGO
ESPAÑOL
ITALIANO
FRANCÉS
ALEMÁN
lema
tipo de complemento
funciones semánticas
estructura sintáctica
lema
tipo de complemento
funciones semánticas
estructura sintáctica
lema
tipo de complemento
funciones semánticas
estructura sintáctica
lema
tipo de complemento
funciones semánticas
estructura sintáctica
lema
tipo de complemento
funciones semánticas
estructura sintáctica
ESTRUCTURAMODULAR
La metodología aplicada en el proyecto CSVEA sirve de punto de partida para PortLex. Se basa, por un lado, en la gramática y lexicografía de valencias y, por otro, en el análisis de amplios corpora. Así, toda realización de cada uno de los actantes queda documentada a través de ejemplos reales y contextualizados tomados del corpus como el CREA para el español, el FranText para el francés y del COSMAS y el Taz-Corpus para el alemán. En esta línea, adoptamos las propuestas de Engel (2009), Zifonun et al. (1997) y Schierholz (2001).
DELABORACIÓN DE UN
CORPUS MULTILINGÜEanotado – español, alemán, gallego, italiano y francés- y de un portal lexicográfico online, modular, rever-sible y multilingüe, metodológica-mente sustentados en la gramática y lexicografía valencial y en la lingüística de corpus
DESARROLLO DE DICCIONARIOSMONOLINGÜES Y CONTRASTIVOS
reversibles y online para las dif-rentes lenguas abordadas en el estudio
INNOVACIÓN ENLA INVESTIGACIÓN
sobre tipología de usuario y arquitectura de la información y desarrollo de métodos empíricos para el estudio del uso deldiccionario.
INVESTIGADORESPueden trabajar con los diferentesmódulos y datos del diccionario
ESTUDIANTES DE UNALENGUA EXTRANJERA
Pueden estar interesados únicamente en el apartado contrastivo del diccionario.
DOCENTESPueden usar esta obra como manual de consulta
PARTIR DE UN DICCIONARIO MADRE
ARQUITECTURA DE LA ENTRADA
ENTRADA
EQUIVALENCIA
INFORMACIÓN MORFOLÓGICA
INFORMACIÓN SINTÁCTICA INFORMACIÓN SEMÁNTICA
TEST DE DELIMITACIÓNDE ARGUMENTOS
EJEMPLOS
COMENTARIOS
Definición de cada acepción
Definición de cada actante
(en base a paráfrasisde los roles semánticos)
Significado categorialSinónimos
Fijación de equivalentesCuestiones contrastivas
Ejemplos de Corpus (CREA, COSMAS, Frantext, Taz-Corpus)Ejemplos acortadosEjemplos basados en competencia lingüística
CasoTipo de realización
Modelo estándarTipo de complemento
Combinatoria actancial y serializaciónCombinatoria con otras clases de palabras
Diferenciación entre actantes específicos y aespecíficosClasificación de actantes específicos
f
VENTAJAS / PROBLEMAS
PROBLEMAS
Equivalencia no plena.
Peso concedido al diccionario madre y su influencia sobre las demás obras
de consulta.
Dificultades de interconexión de datosentre las lenguas que no son el eje de
partida, esto es, el español.
Depuración de los resultados en losdiccionarios que no son madre,
VENTAJAS
Optimizar datos construyendo varios diccionarios desde el español.
Interconectar los resultadosde las diferentes lenguas.
Responder a las necesidadesde diferentes tipos de usuarios.
MINECO (FFI2012-32456)RELEX (CN2012/290)
MARÍA JOSÉ DOMÍNGUEZ VÁZQUEZ (IP)MÓNICA MIRAZO BALSACARLOS VALCÁRCEL RIVEIRO (Uvigo)
PORTLEXPORTAL LEXICOGRÁFICO:
DICCIONARIO ONLINE MODULAR MULTILINGÜE
Y CORPUS INFORMATIZADO ANOTADO
DE LA FRASE NOMINAL
RETO
INVESTIGADORA PRINCIPAL
MARÍA JOSÉ DOMÍNGUEZ VÁZQUEZ (USC)
EQUIPO DE INVESTIGACIÓN
Universidade de Santiago de CompostelaUniversität Nürnberg-Erlangen
Institut für Deutsche Sprache, MannheimUniversidad de Sevilla
Universidade da Coruña Universidad de VigoUniversität Leipzig
investigadores de universidades y centros de investigación de España y Alemania: n14
FINANCIACIÓN
MINISTERIO DE ECONOMÍA Y COMPETITIVIDAD
DURACIÓN
3 AÑOSConcesión provisional:01/02/2013 Código: FFI2012-32456
csvea: embrión de portlex
diccionario madre
DICCIONARIO ESPAÑOL
DICCIONARIO ESPAÑOL
DICCIONARIO ITALIANO
DICCIONARIO ALEMÁN
DICCIONARIO GALEGO
DICCIONARIO FRANCÉS
DICCIONARIO ALEMÁN
DICCIONARIO ESPAÑOL
Crear una base de datos relacional multiidioma bidireccional que nos permita inlcuir el análisis de sustantivos de cada una de las lenguas. Para cada una de las lenguas sería necesario crear diferentes tablas de datos que estarían ligados para hacer posible cualquier búsqueda entre cualquier par de lenguas, siendo el nexo de unión entre todas las lenguas, la ACEPCIÓN (es la información que permanece invariable en cada lengua)
LA ACEPCIÓN COMO NEXO DE UNIÓN
El problema radica aquí en el hecho de que si una acepción no está recogida en el diccionario madre nunca llegaremos a ella desde el español y, probablemente, no se procederá a su descripción.Teniendo en cuenta que estamos construyendo diccionarios reversibles con autonomía propia, la aparición de lagunas interlingüísticas en las fases iniciales del trabajo será, pues, inevitable. ¿Cómo solucionar este problema?
MÁS ALLÁ DEL DICCIONARIO MADRE
CSVABILINGÜE + BIDIRECCIONAL
PORTLEXMULTILINGÜE + MULTIDIRECCIONAL
BASE DE DATOSPara crear una herramienta lexicográfica multifuncional partimos del diccionario español CSVEA para crear un diccionario madre en torno al cual se construyen los diferentes módulos de la base de datos. De esta forma, a partir de una sola base de datos se crean varios diccionarios para que los usuarios puedan realizar búsquedas monolingües, bilingües o multilingües en función de sus necesidades.
multiidiomay bidireccional
multimodular
etiquetadosintáctico-semántico
multifuncional
DIVERSIDAD DE DICCIONARIOS
UNA SOLA BASE DE DATOS
monolingües
bilingües
multulingües
METODOLOGÍA