Post on 10-Oct-2018
Práctica 3OmegaT
Memorias de traducción
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 1
Memorias de traducción
Una memoria de traducción (translation memory) es un
tipo de base de datos lingüística utilizada para
almacenar textos en un idioma origen y sus
correspondientes traducciones a otro idioma destino
Suelen tener asociado un gestor terminológico
La base de datos lingüística de una memoria de
traducción almacena textos o segmentos en una lengua
origen y su correspondiente traducción
El formato estándar de intercambio de datos para
memorias de traducción es el TMX
TMX (Translation Memory
eXchange)
Formato originalmente desarrollado y mantenido por
OSCAR (Open Standards for Container/Content Allowing
Reuse), un grupo de interés de LISA (Localization
Industry Standards Association)
Actualmente bajo licencia Creative Commons
Basado en XML (eXtensible Markup Language)
Estándar para el intercambio de información
estructurada entre diferentes plataformas
Legible tanto por las personas como por las máquinas
TMX viene especificado en una definición de tipo de
documento (document type definition o DTD) de XML
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 3
Ejemplo de XML
XML DTD
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 4
Ejemplo de TMX
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 5
Utilidad de las memorias de
traducción
Volumen de traducciones creciente y frecuentemente se
piden traducciones de textos que contienen párrafos o
frases que ya se han traducido antes en otros proyectos
Por ejemplo, manuales de uso de productos similares
La idea es reutilizar segmentos de texto previamente
traducidos
El lenguaje es bastante repetitivo y se suele utilizar la
misma terminología y expresiones gramaticales
similares para comunicar ideas en un dominio dado
Los traductores literarios o “no técnicos” no se
benefician tanto con su uso ya que su trabajo no es lo
suficientemente repetitivo como para aprovecharlas
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 6
OmegaT
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 7
OmegaT
OmegaT es una aplicación de memoria de traducción
pensada para ser utilizada por traductores profesionales
(no es una herramienta de traducción automática, sino
una herramienta de traducción asistida por
computador)
Coincidencias parciales
Propagación de coincidencias
Procesado simultáneo de proyectos con archivos múltiples
Uso simultáneo de múltiples memorias de traducción
Glosarios externos
(cont. diapositiva siguiente)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 8
OmegaT
Formatos de archivo variados (texto plano, Office,
OpenOffice, etc.)
Soporte Unicode (UTF-8)
Soporte para idiomas derecha-izquierda
Compatible con otras aplicaciones de memoria de
traducción (TMX)
Sistema operativo Windows, Mac OS X y Linux, software
libre
Última versión: 3.6.0, actualización 4 (fecha
13/01/2017)
Sitio web: http://www.omegat.org/
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 9
Instalación de OmegaT
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 10
Instalación de OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 11
Instalación de OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 12
Instalación de OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 13
Instalación de OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 14
Lanzar OmegaT (escritorios
virtuales)
Acceder a escritorios
virtuales
(https://eva.um.es/)
Introducir nuestras
credenciales de la UMU
Seleccionar la opción
ALAS
Instalar el plugin y
aceptar todo hasta que
se abre el escritorio
remoto
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 15
Lanzar OmegaT (ADLA y
escritorios virtuales)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 16
Lanzar OmegaT (ADLA y
escritorios virtuales)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 17
Pantalla principal de OmegaT
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 18
Crear un proyecto en OmegaT
Seleccionamos
“Proyecto” en el menú
Después seleccionamos
“Nuevo”
Indicamos un nombre
para la carpeta del
proyecto
El proyecto no es un
fichero, es la carpeta
completa
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 19
Crear un proyecto en OmegaT
(cont.)
Seleccionamos el idioma
origen y el idioma
destino al que vamos a
traducir
En la sección “Ubicación
de archivos” podemos
ver la estructura del
proyecto (subcarpetas)
Archivos fuente,
memorias de
traducción, glosarios,
diccionarios y archivos
traducidos
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 20
Crear un proyecto en OmegaT
(cont.)
A continuación cargamos
los ficheros que
queremos traducir
Opción “Copiar archivos
a carpeta Source” o
“Desgargar página de
MediaWiki”
Podemos seleccionar
uno o varios, y
ordenarlos
Cuando terminemos
seleccionamos “Cerrar”
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 21
Crear un proyecto en OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 22
Uso de bases de datos
terminológicas en OmegaT
OmegaT es compatible con bases de datos terminológicas en dos formatos:
El formato estándar para bases de datos terminológicas TBX(Term Base eXchange)
Formato de texto separado por tabuladores
término fuente <tab> término destino <tab> información adicional<nueva_línea>
El primer campo es el término en la lengua de origen, el segundo el término en la lengua de destino y el tercero se puede utilizar para comentarios (opcional)
En formato TBX existen muchas bases de datos terminológicas que podremos usar
El texto tabulado es un formato muy sencillo que nos permitirá crear fácilmente nuestros propios glosarios
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 23
Incluir un glosario en OmegaT
Simplemente copiamos el glosario en formato TBX o texto separado por tabuladores (Ctrl+C)
Después, en la carpeta del proyecto, pegamos el fichero en la subcarpeta “glossary” (Ctrl+V)
OmegaT reconoce automáticamente los términos incluidos en el glosario y los subraya en color azul
Si no funciona, seleccionar “Opciones” “Consejos de Traducción” “Habilitar TransTips”
Por ejemplo, podemos obtener un glosario en formato TBX de la página http://iate.europa.eu/tbxPageDownload.do
Descargamos IATE_download.zip
Usamos la herramienta IATExtract
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 24
Incluir un glosario en OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 25
Incluir un glosario en OmegaT
(cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 26
Crear entradas de glosario en
OmegaT
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 27
Incluir corrección ortográfica
en OmegaT
En OmegaT se puede
habilitar la función de
corrección ortográfica
Seleccionar el menú
“Opciones” y dentro de
él “Revisión ortográfica”
Marcar la casilla de
verificación
“Comprobar la
ortografía
automáticamente”
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 28
Incluir corrección ortográfica
en OmegaT (cont.)
Seleccionar un
“Subdirectorio de los
archivos del diccionario”
Indicar una carpeta
donde tengamos
permiso de escritura
Seleccionar “Instalar
nuevo diccionario”
Indicar el idioma (o
idiomas) y después
“Instalar”
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 29
Incluir corrección ortográfica
en OmegaT (cont.)
OmegaT utiliza el
diccionario correcto
automáticamente según
los códigos de idioma
del proyecto y subraya
los términos en color
rojo
Los códigos tienen que
ser exactamente los
mismos
Por ejemplo, un
diccionario FR-FR no
funcionará con un
idioma destino FR
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 30
Incluir corrección ortográfica
en OmegaT (cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 31
Uso de diccionarios en
OmegaT
Los diccionarios en OmegaT están basados en la plataforma StarDict
En primer lugar descargamos el archivo correspondiente al idioma (o combinación de idiomas) requerido
El archivo debe ser de tipo tarball (extensión TAR.BZ o TAR.BZ2)
Cuando se descomprime el archivo original, se obtienen tres archivos con extensiones DZ, IDX e IFO
Se deben copiar los ficheros a la carpeta “dictionary”
Por ejemplo, podemos descargar un diccionario de la página https://sites.google.com/site/gtonguedict/home/stardict-dictionaries
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 32
Incluir un diccionario en
OmegaT
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 33
Uso de memorias de
traducción en OmegaT
Los archivos TMX de memoria de traducción pueden estar en varios lugares en los proyectos de OmegaT:
Subcarpeta “omegat”
Contiene el archivo project_save.tmx que incluye los segmentos que se han grabado en la memoria de traducción desde que empezó el proyecto
Contiene posiblemente una serie de archivos de copias de seguridad TMX (extensión BAK)
Carpeta principal
Contiene tres archivos TMX: NP-omegat.tmx, NP-level1.tmx y NP-level2.tmx (donde “NP” es el nombre del proyecto)
Estos archivos son copias del archivo project_save.tmx, es decir, de la memoria de traducción principal del proyecto, excluyendo los así llamados segmentos huérfanos
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 34
Uso de memorias de traducción
en OmegaT (cont.)
Subcarpeta “tm”
Puede contener cualquier número de memorias de traducción auxiliares TMX
El contenido de estas memorias de traducción sirve para generar sugerencias para el texto a traducir
Cualquier texto, ya traducido y almacenado en estos archivos, aparece entre las coincidencias parciales, si es lo suficientemente similar al texto que se está traduciendo
Subcarpeta “tm/auto”
Se pueden poner aquí las memorias de traducción que pensamos que son correctas, para pretraducir el texto fuente, evitando la confirmación manual de una gran cantidad de casos
Las traducciones que se puedan encontrar en estas memorias de traducción “auto”, aterrizarán en la memoria de traducción principal del proyecto sin la intervención del usuario
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 35
Incluir una memoria de
traducción en OmegaT
Simplemente copiamos la memoria de traducción en formato TMX (Ctrl+C)
Después, en la carpeta del proyecto, pegamos el fichero en la subcarpeta “tm” (Ctrl+V)
OmegaT reconoce automáticamente los segmentos de texto y los muestra en el área de “Coincidencias parciales”
Por ejemplo, podemos obtener una memoria de traducción en formato TMX de la página https://ec.europa.eu/jrc/en/language-technologies/dgt-translation-memory
Descargamos el cuerpo paralelo (un subconjunto es suficiente) con extensión ZIP
Usamos la herramienta TMXtract para extraer el par de idiomas que nos interese
java -jar TMXtract.jar EN ES output.tmx
Vol_2015_1.zip
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 36
Incluir una memoria de
traducción en OmegaT (cont.)
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 37
Traducir con OmegaT
OmegaT presenta en el área de edición un segmento
cada vez para que sea traducido
Podemos utilizar las coincidencias parciales de la memoria
de traducción, el glosario y el diccionario, en su caso,
para facilitar el proceso de traducción
Después de traducir un segmento dado, podemos pasar
al siguiente segmento sin traducir (Ctrl+U) o al
siguiente segmento traducido (Ctrl+Shift+U), entre
otras opciones
Para ver la traducción en el formato final, se pueden
generar los documentos traducidos (Ctrl+D)
Se generan en la subcarpeta “target”
Segundo Cuatrimestre. Curso 2016/2017Informática aplicada a la traducción II 38
Recursos
OmegaT for CAT Beginners:
http://www.omegat.org/gl/tutorial/OmegaT_for_Beginner
s.pdf
OmegaT - Guía de usuario:
http://omegat.sourceforge.net/manual-
latest/es/index.html
UOC – Traducción y tecnologías:
https://sites.google.com/a/uoc.edu/traduccion-y-
tecnologias/home