Download - Macarena_Ortiz_Saul_BloqueII
ÍNDICE1. Corpus y traducción
a. Tipos de corpus 1) Monolingüe 2) Bilingüe/Multilingüe
b. Herramienta de ayuda a la traducción 1) Diccionario/Corpus 2) Corpus virtuales 3) Corpus robustos
c. British National Corpus (BNC)
2. Memorias de traducción
a. Herramientas de traducción asistida 1) Origen 2) Componentes habituales
b. Editor 1) Memorias de traducción 2) Equivalente exacto o 100% 3) Equivalente parcial 4) Pretraducción
c. Gestor terminológicod. Funciones de control de calidad
3. Alineación de textos
a. Alineadores 1) Déjà vu (DVX) 2) Trados
CORPUSY
TRADUCCIÓN
CORPUSDefinición
• Conjunto estructurado y documentado de textos
• Ejemplos reales de uso de la lengua
• Lingüística del corpus: estudia la lengua a través de estas muestras
• Monolingüe• Bilingüe/Multilingüe:
comparable paralelo alineado direccional idiomas nº de textos traducidos
TIPOS DE CORPUS
http://es.wikipedia.org/wiki/Corpus_lingüístico
• Textos de una sola lengua
• Misma temática
• No son traducciones
• Objetivo: dar cuenta de una lengua o variedad lingüística
TIPOS DE CORPUSMonolingüe
• Textos en más de una lengua
• Misma temática
• Características similares
• Es posible establecer comparaciones interlingüísticas
TIPOS DE CORPUSBilingüe/Multilingüe COMPARABLE
• Textos en más de una lengua (bilingües o multilingües)
• El mismo texto traducido
• Útiles en la traducción automática
• Entornos: la ONU, la OTAN, la UE o Canadá
• ORIGEN: Edad Media “biblias políglotas”, contenían textos uno al lado de otro en hebreo, latín y griego, y a veces también versiones vernáculas
• Está alineados
• El caso más conocido: Hansard Corpus actas del parlamento canadiense publicadas en francés e inglés
TIPOS DE CORPUSBilingüe/Multilingüe PARALELO
• Textos están dispuestos unos al lado de otros en párrafos o frases
• Los pares de frases están identificados estableciendo las correspondencias
• Más fácil extraer las equivalencias de traducción: elementos que son traducciones mutuas
• La alineación de oraciones y palabras se puede conseguir automática o semiautomáticamente con un alto grado de exactitud
TIPOS DE CORPUS
Bilingüe/Multilingüe ALINEADO
• Colecciones de textos en varios idiomas
• Función: servir para estudios cuantitativos o estadísticos
• Criterios de selección muy diversos
TIPOS DE CORPUSBilingüe/Multilingüe IDIOMAS
• Diccionario: versión sintética (definición)
Equivalencias fuera de contexto
• Corpus: versión analítica (varios contextos)
CORPUS: herramienta de ayuda a la traducción
Corpus / Diccionario
• Elaborados por el traductor• Proyecto concreto de traducción• No son de acceso público• Información recogida en Internet• Información sobre términos y expresiones concretas
CORPUS: herramienta de ayuda a la traducción
Corpus virtuales (DIY)
• Estables y aceptados por la comunidad investigadora• Elaborados según criterios estrictos• Alto grado de fiabilidad• Gran cantidad de información• Incluyen información lingüística (corpus anotados)• Software de búsqueda• BNC (http://www.natcorp.ox.ac.uk/)
CORPUS: herramienta de ayuda a la traducción
Corpus robustos
• Corpus de inglés británico contemporáneo• Más de 100 millones de palabras• Contiene anotaciones de tipo textual y gramatical• Ejemplos escritos y orales
• Parte escrita (90%): extractos de periódicos regionales y nacionales libros académicos y de ficción redacciones de colegio y universidad, etc.
• Parte oral (10%): Transcripciones de conversaciones informales Textos orales de diferentes contextos: negocios y reuniones de del gobierno, registro formal Programas de radio y con llamadas del público, etc.
http://www.natcorp.ox.ac.uk
BRITISH NATIONAL CORPUS (BNC)
MEMORIAS DE TRADUCCIÓN
Traducción técnica especializada
MEMORIAS DE TRADUCCIÓN
• Herramientas que permiten al traductor reaprovechar las traducciones
• El texto traducido se almacena en:
bases de datos sistemas de material de referencia que gestionan segmentos de texto alineados (original y traducción)
• El texto se puede recuperar si durante la traducción aparecen segmentos idénticos o con cierto porcentaje de similitud
http://es.wikipedia.org/wiki/Memoria_de_traducción
ORIGEN
• Años 80
• Necesidad de diseñar sistemas de traducción, para reaprovechar todo el texto
• Ahorro temporal y económico
HERRAMIENTAS DE TRADUCCIÓN ASISTIDA (TAO)
COMPONENTES HABITUALES
• Memoria de traducción
• Editor de texto
• Sistemas de gestión de terminología
• Funciones de control de calidad
HERRAMIENTAS DE TRADUCCIÓN ASISTIDA (TAO)
http://es.wikipedia.org/wiki/Traducción_asistida
Espacio de trabajo para:
• Traducir• Borrar• Mover• Copiar• Crear marcos• Utilizar corrector ortográfico• etc.
EDITOR
• Unidad: segmento
• Puede ser: una frase un párrafo la celda de una tabla los elementos de una lista, etc.
• Criterio de segmentación puede variar
• Segmentación: fundamental para aprovechar el texto almacenado en la memoria
MEMORIAS DE TRADUCCIÓN
EDITOR
• Segmento del texto original
• Exactamente igual a uno de los segmentos almacenados en la memoria
El sistema lo detecta automáticamente
Se lo comunica al traductor para que lo pueda reaprovechar
• Puede haber mas de una traducción exacta almacenada en la memoria Traducción múltiple
EQUIVALENTE EXACTO o 100%
EDITOR
• Segmento con cierto porcentaje de similitud
• Se indica mediante códigos de colores
• Umbral: 30 – 99 %
• Al principio: trabar con un porcentaje bajo
• Cuanto más alto el porcentaje, menos trabajo
de revisión y traducción
EQUIVALENTE PARCIAL
EDITOR
• Traducir de modo automático segmentos que presenten equivalentes exactos
• Traductor: solo traduce coincidencias parciales o segmentos sin equivalentes
• Normalmente no necesita revisión, pero es recomendable revisar los segmentos
• La gestión de las memorias de traducción es fundamental
PRETRADUCCIÓN
EDITOR
Consultar Recuperar Introducir
Términos
• Coherencia terminológica
fundamental
GESTOR TERMINOLÓGICO
http://es.wikipedia.org/wiki/Gestores_de_terminología
• Análisis previo del texto: porcentaje de similitud porcentaje de repetición
(intertextual e intratextual) establecer nº de palabras que
facturará el traductor
• Traducción de diferentes tipos de
segmentos tarifa diferente
FUNCIONES DE CONTROL DE CALIDAD
ALINEACIÓN DE TEXTOS
• A partir de dos textos de lenguas diferentes enlaza segmentos más pequeños de una lengua con la otra
• Permite crear o alimentar las memorias de traducción
• Se hallan integradas en los sistemas de traducción asistida
ALINEADORES
• Programa de traducción asistida por ordenador
• Elaborado por la empresa española Atril
• Grupo: programas de memoria de traducción
• Pretraducción del texto a partir de una base de datos formada por el corpus de traducciones realizadas previamente por el traductor
• Reutiliza frases traducidas anteriormente
• Extrae equivalencias multilingües a partir de los textos activos
• Otras posibilidades: Filtros para varios programas de autoedición Alineador de corpus Gestor de terminología, etc.
• Todas las bases de datos se pueden invertir de una base inglés>francés se puede crear la base francés>inglés
DÉJÀ VU (DVX)Sistema de traducción automática
www.atril.com
http://www.trados.com/en/
TRADOS• Programa de memoria de traducción• Herramienta que asiste al traductor • Divide el original en segmentos (normalmente frases)• Alinea originales y traducciones ya hechas• La memoria de traducción va aumentando
• El traductor puede: reutilizar la traducción modificar la traducción anterior traducir en forma distinta
• Características: Recuerda cómo se ha traducido cada segmento en traducciones anteriores Recupera las traducciones existentes y las ‘reciclarla’ en traducciones futuras Crea memorias de traducción con el trabajo anterior o con documentos facilitados por el cliente Paquete de gestión de terminología Reduce la cantidad de consultas y trabajos repetitivos Asegura consistencia tanto en un documento como entre varios Costes y esfuerzos más bajos Soporte para idiomas cirílicos, asiáticos y orientales