presentación de powerpoint - um.es · volumen de traducciones creciente y frecuentemente se ......

39
Práctica 3 OmegaT Memorias de traducción Segundo Cuatrimestre. Curso 2016/2017 Informática aplicada a la traducción II 1

Upload: lamdien

Post on 10-Oct-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Práctica 3OmegaT

Memorias de traducción

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 1

Page 2: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Memorias de traducción

Una memoria de traducción (translation memory) es un

tipo de base de datos lingüística utilizada para

almacenar textos en un idioma origen y sus

correspondientes traducciones a otro idioma destino

Suelen tener asociado un gestor terminológico

La base de datos lingüística de una memoria de

traducción almacena textos o segmentos en una lengua

origen y su correspondiente traducción

El formato estándar de intercambio de datos para

memorias de traducción es el TMX

Page 3: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

TMX (Translation Memory

eXchange)

Formato originalmente desarrollado y mantenido por

OSCAR (Open Standards for Container/Content Allowing

Reuse), un grupo de interés de LISA (Localization

Industry Standards Association)

Actualmente bajo licencia Creative Commons

Basado en XML (eXtensible Markup Language)

Estándar para el intercambio de información

estructurada entre diferentes plataformas

Legible tanto por las personas como por las máquinas

TMX viene especificado en una definición de tipo de

documento (document type definition o DTD) de XML

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 3

Page 4: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Ejemplo de XML

XML DTD

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 4

Page 5: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Ejemplo de TMX

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 5

Page 6: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Utilidad de las memorias de

traducción

Volumen de traducciones creciente y frecuentemente se

piden traducciones de textos que contienen párrafos o

frases que ya se han traducido antes en otros proyectos

Por ejemplo, manuales de uso de productos similares

La idea es reutilizar segmentos de texto previamente

traducidos

El lenguaje es bastante repetitivo y se suele utilizar la

misma terminología y expresiones gramaticales

similares para comunicar ideas en un dominio dado

Los traductores literarios o “no técnicos” no se

benefician tanto con su uso ya que su trabajo no es lo

suficientemente repetitivo como para aprovecharlas

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 6

Page 7: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

OmegaT

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 7

Page 8: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

OmegaT

OmegaT es una aplicación de memoria de traducción

pensada para ser utilizada por traductores profesionales

(no es una herramienta de traducción automática, sino

una herramienta de traducción asistida por

computador)

Coincidencias parciales

Propagación de coincidencias

Procesado simultáneo de proyectos con archivos múltiples

Uso simultáneo de múltiples memorias de traducción

Glosarios externos

(cont. diapositiva siguiente)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 8

Page 9: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

OmegaT

Formatos de archivo variados (texto plano, Office,

OpenOffice, etc.)

Soporte Unicode (UTF-8)

Soporte para idiomas derecha-izquierda

Compatible con otras aplicaciones de memoria de

traducción (TMX)

Sistema operativo Windows, Mac OS X y Linux, software

libre

Última versión: 3.6.0, actualización 4 (fecha

13/01/2017)

Sitio web: http://www.omegat.org/

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 9

Page 10: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Instalación de OmegaT

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 10

Page 11: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Instalación de OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 11

Page 12: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Instalación de OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 12

Page 13: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Instalación de OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 13

Page 14: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Instalación de OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 14

Page 15: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Lanzar OmegaT (escritorios

virtuales)

Acceder a escritorios

virtuales

(https://eva.um.es/)

Introducir nuestras

credenciales de la UMU

Seleccionar la opción

ALAS

Instalar el plugin y

aceptar todo hasta que

se abre el escritorio

remoto

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 15

Page 16: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Lanzar OmegaT (ADLA y

escritorios virtuales)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 16

Page 17: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Lanzar OmegaT (ADLA y

escritorios virtuales)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 17

Page 18: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Pantalla principal de OmegaT

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 18

Page 19: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Crear un proyecto en OmegaT

Seleccionamos

“Proyecto” en el menú

Después seleccionamos

“Nuevo”

Indicamos un nombre

para la carpeta del

proyecto

El proyecto no es un

fichero, es la carpeta

completa

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 19

Page 20: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Crear un proyecto en OmegaT

(cont.)

Seleccionamos el idioma

origen y el idioma

destino al que vamos a

traducir

En la sección “Ubicación

de archivos” podemos

ver la estructura del

proyecto (subcarpetas)

Archivos fuente,

memorias de

traducción, glosarios,

diccionarios y archivos

traducidos

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 20

Page 21: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Crear un proyecto en OmegaT

(cont.)

A continuación cargamos

los ficheros que

queremos traducir

Opción “Copiar archivos

a carpeta Source” o

“Desgargar página de

MediaWiki”

Podemos seleccionar

uno o varios, y

ordenarlos

Cuando terminemos

seleccionamos “Cerrar”

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 21

Page 22: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Crear un proyecto en OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 22

Page 23: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Uso de bases de datos

terminológicas en OmegaT

OmegaT es compatible con bases de datos terminológicas en dos formatos:

El formato estándar para bases de datos terminológicas TBX(Term Base eXchange)

Formato de texto separado por tabuladores

término fuente <tab> término destino <tab> información adicional<nueva_línea>

El primer campo es el término en la lengua de origen, el segundo el término en la lengua de destino y el tercero se puede utilizar para comentarios (opcional)

En formato TBX existen muchas bases de datos terminológicas que podremos usar

El texto tabulado es un formato muy sencillo que nos permitirá crear fácilmente nuestros propios glosarios

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 23

Page 24: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir un glosario en OmegaT

Simplemente copiamos el glosario en formato TBX o texto separado por tabuladores (Ctrl+C)

Después, en la carpeta del proyecto, pegamos el fichero en la subcarpeta “glossary” (Ctrl+V)

OmegaT reconoce automáticamente los términos incluidos en el glosario y los subraya en color azul

Si no funciona, seleccionar “Opciones” “Consejos de Traducción” “Habilitar TransTips”

Por ejemplo, podemos obtener un glosario en formato TBX de la página http://iate.europa.eu/tbxPageDownload.do

Descargamos IATE_download.zip

Usamos la herramienta IATExtract

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 24

Page 25: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir un glosario en OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 25

Page 26: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir un glosario en OmegaT

(cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 26

Page 27: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Crear entradas de glosario en

OmegaT

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 27

Page 28: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir corrección ortográfica

en OmegaT

En OmegaT se puede

habilitar la función de

corrección ortográfica

Seleccionar el menú

“Opciones” y dentro de

él “Revisión ortográfica”

Marcar la casilla de

verificación

“Comprobar la

ortografía

automáticamente”

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 28

Page 29: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir corrección ortográfica

en OmegaT (cont.)

Seleccionar un

“Subdirectorio de los

archivos del diccionario”

Indicar una carpeta

donde tengamos

permiso de escritura

Seleccionar “Instalar

nuevo diccionario”

Indicar el idioma (o

idiomas) y después

“Instalar”

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 29

Page 30: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir corrección ortográfica

en OmegaT (cont.)

OmegaT utiliza el

diccionario correcto

automáticamente según

los códigos de idioma

del proyecto y subraya

los términos en color

rojo

Los códigos tienen que

ser exactamente los

mismos

Por ejemplo, un

diccionario FR-FR no

funcionará con un

idioma destino FR

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 30

Page 31: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir corrección ortográfica

en OmegaT (cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 31

Page 32: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Uso de diccionarios en

OmegaT

Los diccionarios en OmegaT están basados en la plataforma StarDict

En primer lugar descargamos el archivo correspondiente al idioma (o combinación de idiomas) requerido

El archivo debe ser de tipo tarball (extensión TAR.BZ o TAR.BZ2)

Cuando se descomprime el archivo original, se obtienen tres archivos con extensiones DZ, IDX e IFO

Se deben copiar los ficheros a la carpeta “dictionary”

Por ejemplo, podemos descargar un diccionario de la página https://sites.google.com/site/gtonguedict/home/stardict-dictionaries

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 32

Page 33: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir un diccionario en

OmegaT

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 33

Page 34: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Uso de memorias de

traducción en OmegaT

Los archivos TMX de memoria de traducción pueden estar en varios lugares en los proyectos de OmegaT:

Subcarpeta “omegat”

Contiene el archivo project_save.tmx que incluye los segmentos que se han grabado en la memoria de traducción desde que empezó el proyecto

Contiene posiblemente una serie de archivos de copias de seguridad TMX (extensión BAK)

Carpeta principal

Contiene tres archivos TMX: NP-omegat.tmx, NP-level1.tmx y NP-level2.tmx (donde “NP” es el nombre del proyecto)

Estos archivos son copias del archivo project_save.tmx, es decir, de la memoria de traducción principal del proyecto, excluyendo los así llamados segmentos huérfanos

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 34

Page 35: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Uso de memorias de traducción

en OmegaT (cont.)

Subcarpeta “tm”

Puede contener cualquier número de memorias de traducción auxiliares TMX

El contenido de estas memorias de traducción sirve para generar sugerencias para el texto a traducir

Cualquier texto, ya traducido y almacenado en estos archivos, aparece entre las coincidencias parciales, si es lo suficientemente similar al texto que se está traduciendo

Subcarpeta “tm/auto”

Se pueden poner aquí las memorias de traducción que pensamos que son correctas, para pretraducir el texto fuente, evitando la confirmación manual de una gran cantidad de casos

Las traducciones que se puedan encontrar en estas memorias de traducción “auto”, aterrizarán en la memoria de traducción principal del proyecto sin la intervención del usuario

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 35

Page 36: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir una memoria de

traducción en OmegaT

Simplemente copiamos la memoria de traducción en formato TMX (Ctrl+C)

Después, en la carpeta del proyecto, pegamos el fichero en la subcarpeta “tm” (Ctrl+V)

OmegaT reconoce automáticamente los segmentos de texto y los muestra en el área de “Coincidencias parciales”

Por ejemplo, podemos obtener una memoria de traducción en formato TMX de la página https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory

Descargamos el cuerpo paralelo (un subconjunto es suficiente) con extensión ZIP

Usamos la herramienta TMXtract para extraer el par de idiomas que nos interese

java -jar TMXtract.jar EN ES output.tmx

Vol_2015_1.zip

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 36

Page 37: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Incluir una memoria de

traducción en OmegaT (cont.)

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 37

Page 38: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Traducir con OmegaT

OmegaT presenta en el área de edición un segmento

cada vez para que sea traducido

Podemos utilizar las coincidencias parciales de la memoria

de traducción, el glosario y el diccionario, en su caso,

para facilitar el proceso de traducción

Después de traducir un segmento dado, podemos pasar

al siguiente segmento sin traducir (Ctrl+U) o al

siguiente segmento traducido (Ctrl+Shift+U), entre

otras opciones

Para ver la traducción en el formato final, se pueden

generar los documentos traducidos (Ctrl+D)

Se generan en la subcarpeta “target”

Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 38

Page 39: Presentación de PowerPoint - um.es · Volumen de traducciones creciente y frecuentemente se ... (cont. diapositiva siguiente) Informática aplicada a la traducción II Segundo Cuatrimestre

Recursos

OmegaT for CAT Beginners:

http://www.omegat.org/gl/tutorial/OmegaT_for_Beginner

s.pdf

OmegaT - Guía de usuario:

http://omegat.sourceforge.net/manual-

latest/es/index.html

UOC – Traducción y tecnologías:

https://sites.google.com/a/uoc.edu/traduccion-y-

tecnologias/home