macarena ortiz saul bloque ii

28
ÍNDICE 1. Corpus y traducción a. Tipos de corpus 1) Monolingüe 2) Bilingüe/Multilingüe b. Herramienta de ayuda a la traducción 1) Diccionario/Corpus 2) Corpus virtuales 3) Corpus robustos c. British National Corpus (BNC) 2. Memorias de traducción a. Herramientas de traducción asistida 1) Origen 2) Componentes habituales b. Editor 1) Memorias de traducción 2) Equivalente exacto o 100% 3) Equivalente parcial 4) Pretraducción c. Gestor terminológico d. Funciones de control de calidad 3. Alineación de textos a. Alineadores 1) Déjà vu (DVX) 2) Trados

Upload: makarenaaaaa

Post on 29-Nov-2014

2.020 views

Category:

Documents


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Macarena Ortiz Saul Bloque II

ÍNDICE1. Corpus y traducción

a. Tipos de corpus 1) Monolingüe 2) Bilingüe/Multilingüe

b. Herramienta de ayuda a la traducción 1) Diccionario/Corpus 2) Corpus virtuales 3) Corpus robustos

c. British National Corpus (BNC)

2. Memorias de traducción

a. Herramientas de traducción asistida 1) Origen 2) Componentes habituales

b. Editor 1) Memorias de traducción 2) Equivalente exacto o 100% 3) Equivalente parcial 4) Pretraducción

c. Gestor terminológicod. Funciones de control de calidad

3. Alineación de textos

a. Alineadores 1) Déjà vu (DVX) 2) Trados

Page 2: Macarena Ortiz Saul Bloque II

CORPUSY

TRADUCCIÓN

Page 3: Macarena Ortiz Saul Bloque II

CORPUSDefinición

• Conjunto estructurado y documentado de textos

• Ejemplos reales de uso de la lengua

• Lingüística del corpus: estudia la lengua a través de estas muestras

Page 4: Macarena Ortiz Saul Bloque II

• Monolingüe• Bilingüe/Multilingüe:

comparable paralelo alineado direccional idiomas nº de textos traducidos

TIPOS DE CORPUS

http://es.wikipedia.org/wiki/Corpus_lingüístico

Page 5: Macarena Ortiz Saul Bloque II

• Textos de una sola lengua

• Misma temática

• No son traducciones

• Objetivo: dar cuenta de una lengua o variedad lingüística

TIPOS DE CORPUSMonolingüe

Page 6: Macarena Ortiz Saul Bloque II

• Textos en más de una lengua

• Misma temática

• Características similares

• Es posible establecer comparaciones interlingüísticas

TIPOS DE CORPUSBilingüe/Multilingüe COMPARABLE

Page 7: Macarena Ortiz Saul Bloque II

• Textos en más de una lengua (bilingües o multilingües)

• El mismo texto traducido

• Útiles en la traducción automática

• Entornos: la ONU, la OTAN, la UE o Canadá

• ORIGEN: Edad Media “biblias políglotas”, contenían textos uno al lado de otro en hebreo, latín y griego, y a veces también versiones vernáculas

• Está alineados

• El caso más conocido: Hansard Corpus actas del parlamento canadiense publicadas en francés e inglés

TIPOS DE CORPUSBilingüe/Multilingüe PARALELO

Page 8: Macarena Ortiz Saul Bloque II

• Textos están dispuestos unos al lado de otros en párrafos o frases

• Los pares de frases están identificados estableciendo las correspondencias

• Más fácil extraer las equivalencias de traducción: elementos que son traducciones mutuas

• La alineación de oraciones y palabras se puede conseguir automática o semiautomáticamente con un alto grado de exactitud

TIPOS DE CORPUS

Bilingüe/Multilingüe ALINEADO

Page 9: Macarena Ortiz Saul Bloque II

• Colecciones de textos en varios idiomas

• Función: servir para estudios cuantitativos o estadísticos

• Criterios de selección muy diversos

TIPOS DE CORPUSBilingüe/Multilingüe IDIOMAS

Page 10: Macarena Ortiz Saul Bloque II

• Diccionario: versión sintética (definición)

Equivalencias fuera de contexto

• Corpus: versión analítica (varios contextos)

CORPUS: herramienta de ayuda a la traducción

Corpus / Diccionario

Page 11: Macarena Ortiz Saul Bloque II

• Elaborados por el traductor• Proyecto concreto de traducción• No son de acceso público• Información recogida en Internet• Información sobre términos y expresiones concretas

CORPUS: herramienta de ayuda a la traducción

Corpus virtuales (DIY)

Page 12: Macarena Ortiz Saul Bloque II

• Estables y aceptados por la comunidad investigadora• Elaborados según criterios estrictos• Alto grado de fiabilidad• Gran cantidad de información• Incluyen información lingüística (corpus anotados)• Software de búsqueda• BNC (http://www.natcorp.ox.ac.uk/)

CORPUS: herramienta de ayuda a la traducción

Corpus robustos

Page 13: Macarena Ortiz Saul Bloque II

• Corpus de inglés británico contemporáneo• Más de 100 millones de palabras• Contiene anotaciones de tipo textual y gramatical• Ejemplos escritos y orales

• Parte escrita (90%): extractos de periódicos regionales y nacionales libros académicos y de ficción redacciones de colegio y universidad, etc.

• Parte oral (10%): Transcripciones de conversaciones informales Textos orales de diferentes contextos: negocios y reuniones de del gobierno, registro formal Programas de radio y con llamadas del público, etc.

http://www.natcorp.ox.ac.uk

BRITISH NATIONAL CORPUS (BNC)

Page 14: Macarena Ortiz Saul Bloque II

MEMORIAS DE TRADUCCIÓN

Traducción técnica especializada

Page 15: Macarena Ortiz Saul Bloque II

MEMORIAS DE TRADUCCIÓN

• Herramientas que permiten al traductor reaprovechar las traducciones

• El texto traducido se almacena en:

bases de datos sistemas de material de referencia que gestionan segmentos de texto alineados (original y traducción)

• El texto se puede recuperar si durante la traducción aparecen segmentos idénticos o con cierto porcentaje de similitud

http://es.wikipedia.org/wiki/Memoria_de_traducción

Page 16: Macarena Ortiz Saul Bloque II

ORIGEN

• Años 80

• Necesidad de diseñar sistemas de traducción, para reaprovechar todo el texto

• Ahorro temporal y económico

HERRAMIENTAS DE TRADUCCIÓN ASISTIDA (TAO)

Page 17: Macarena Ortiz Saul Bloque II

COMPONENTES HABITUALES

• Memoria de traducción

• Editor de texto

• Sistemas de gestión de terminología

• Funciones de control de calidad

HERRAMIENTAS DE TRADUCCIÓN ASISTIDA (TAO)

http://es.wikipedia.org/wiki/Traducción_asistida

Page 18: Macarena Ortiz Saul Bloque II

Espacio de trabajo para:

• Traducir• Borrar• Mover• Copiar• Crear marcos• Utilizar corrector ortográfico• etc.

EDITOR

Page 19: Macarena Ortiz Saul Bloque II

• Unidad: segmento

• Puede ser: una frase un párrafo la celda de una tabla los elementos de una lista, etc.

• Criterio de segmentación puede variar

• Segmentación: fundamental para aprovechar el texto almacenado en la memoria

MEMORIAS DE TRADUCCIÓN

EDITOR

Page 20: Macarena Ortiz Saul Bloque II

• Segmento del texto original

• Exactamente igual a uno de los segmentos almacenados en la memoria

El sistema lo detecta automáticamente

Se lo comunica al traductor para que lo pueda reaprovechar

• Puede haber mas de una traducción exacta almacenada en la memoria Traducción múltiple

EQUIVALENTE EXACTO o 100%

EDITOR

Page 21: Macarena Ortiz Saul Bloque II

• Segmento con cierto porcentaje de similitud

• Se indica mediante códigos de colores

• Umbral: 30 – 99 %

• Al principio: trabar con un porcentaje bajo

• Cuanto más alto el porcentaje, menos trabajo

de revisión y traducción

EQUIVALENTE PARCIAL

EDITOR

Page 22: Macarena Ortiz Saul Bloque II

• Traducir de modo automático segmentos que presenten equivalentes exactos

• Traductor: solo traduce coincidencias parciales o segmentos sin equivalentes

• Normalmente no necesita revisión, pero es recomendable revisar los segmentos

• La gestión de las memorias de traducción es fundamental

PRETRADUCCIÓN

EDITOR

Page 24: Macarena Ortiz Saul Bloque II

• Análisis previo del texto: porcentaje de similitud porcentaje de repetición

(intertextual e intratextual) establecer nº de palabras que

facturará el traductor

• Traducción de diferentes tipos de

segmentos tarifa diferente

FUNCIONES DE CONTROL DE CALIDAD

Page 25: Macarena Ortiz Saul Bloque II

ALINEACIÓN DE TEXTOS

Page 26: Macarena Ortiz Saul Bloque II

• A partir de dos textos de lenguas diferentes enlaza segmentos más pequeños de una lengua con la otra

• Permite crear o alimentar las memorias de traducción

• Se hallan integradas en los sistemas de traducción asistida

ALINEADORES

Page 27: Macarena Ortiz Saul Bloque II

• Programa de traducción asistida por ordenador

• Elaborado por la empresa española Atril

• Grupo: programas de memoria de traducción

• Pretraducción del texto a partir de una base de datos formada por el corpus de traducciones realizadas previamente por el traductor

• Reutiliza frases traducidas anteriormente

• Extrae equivalencias multilingües a partir de los textos activos

• Otras posibilidades: Filtros para varios programas de autoedición Alineador de corpus Gestor de terminología, etc.

• Todas las bases de datos se pueden invertir de una base inglés>francés se puede crear la base francés>inglés

DÉJÀ VU (DVX)Sistema de traducción automática

www.atril.com

Page 28: Macarena Ortiz Saul Bloque II

http://www.trados.com/en/

TRADOS• Programa de memoria de traducción• Herramienta que asiste al traductor • Divide el original en segmentos (normalmente frases)• Alinea originales y traducciones ya hechas• La memoria de traducción va aumentando

• El traductor puede: reutilizar la traducción modificar la traducción anterior traducir en forma distinta

• Características: Recuerda cómo se ha traducido cada segmento en traducciones anteriores Recupera las traducciones existentes y las ‘reciclarla’ en traducciones futuras Crea memorias de traducción con el trabajo anterior o con documentos facilitados por el cliente Paquete de gestión de terminología Reduce la cantidad de consultas y trabajos repetitivos Asegura consistencia tanto en un documento como entre varios Costes y esfuerzos más bajos Soporte para idiomas cirílicos, asiáticos y orientales