ADVERTIMENT. Lʼaccés als continguts dʼaquesta tesi queda condicionat a lʼacceptació de les condicions dʼús establertesperlasegüentllicènciaCreativeCommons: http://cat.creativecommons.org/?page_id=184 ADVERTENCIA.Elaccesoaloscontenidosdeestatesisquedacondicionadoalaaceptacióndelascondicionesdeuso establecidasporlasiguientelicenciaCreativeCommons: http://es.creativecommons.org/blog/licencias/ WARNING.Theaccesstothecontentsofthisdoctoralthesisitislimitedtotheacceptanceoftheuseconditionsset bythefollowingCreativeCommonslicense: https://creativecommons.org/licenses/?lang=en RESUMEN Y PALABRAS CLAVES Resumen Esta tesis pretende realizar un estudio descriptivo de la problemática de la traducción de textos técnicos del alemán al castellano mediante traducción automática y elaborar una guía de ayuda para la posedi- ción de dichas traducciones. La hipótesis parte del hecho de que el resultado de las traducciones automáticas hasta el momento no es satisfactorio; que presentan ca- rencias que sólo se pueden solucionar mediante el proceso de la po- sedición. Nuestra hipótesis consiste en que es posible sistematizar el tipo de problemas de traducción provocados por el uso de la traduc- ción automática en una combinación lingüística y un género determi- nados y que la identificación de estos problemas permitirá elaborar una guía de directrices para la posedición. Palabras claves Traductología, traducción automática, tecnologías de la traducción, posedición, errores en la traducción, problemas de la traducción, di- rectrices para la posedición, motores de traducción automática, con- trol de calidad de la traducción, formación del poseditor, ayuda en la posedición. i ABSTRACT AND KEY WORDS Abstract At present, automatic translations of technical texts from one lan- guage to another show deficiencies that can only be solved through a post-editing process. This Thesis intends to study the problems encountered in the ma- chine translation of technical texts from German into Spanish and create a practical guide that helps with the post-editing of those trans- lations. We hypothesize that it is possible to implement a system to identify the problems found in an automatic translation in a linguistic combination and a settled genre that would allow us to create a co- herent, established guide to help with the post-editing process. Key words Translation studies, translation technologies, machine translation, post-editing, translation errors, translation problems, guidelines for post-edition, automatic translation engines, translation quality con- trol, post-editor training, post-edition guidelines ii LISTA DE ABREVIATURAS BLEU BiLingual Evaluation Understudy CAT Computer-Aided Translation DQF Dynamic Quality Framework DFKI Deutsche Forschungszentrum für Künstliche Intelligenz EBMT Example Based Machine Translation FAHQT Fully Automatic High Quality Translation HAMT Human Aided Machine Translation LISA Localization Industry Standards Association LV Distancia de teclado Levenshtein LSP Language Service Provider MAHT Machine Aided Human Translation MT Machine Translation MQM Multidimensional Quality Metrics NIST National Institute of Standards PE Posedición RBMT Rule-Based Machine Translation SGET Sistemas de Gestión y de Edición de Traducciones SMT Statistical Machine Translation TA Traducción automática TAO Traducción Asistida por Ordenador TAP Think Aloud Protocol TAUS Translation Automaton User Society TER Translation Edit Rate TM Translation Memory WER Word Error Rate iii iv ÍNDICE Resumen y palabras claves .......................................................................................................... i Abstract and key words .............................................................................................................. ii Lista de abreviaturas .................................................................................................................. iii Índice .......................................................................................................................................... v INTRODUCCIÓN ..................................................................................................................... 1 PARTE I: MARCO TEÓRICO .................................................................................................. 7 1. Traducción, traducción técnica, problemas de la traducción ....................................... 8 1.1 Definición de traducción ............................................................................................. 8 1.1.1 La equivalencia en la traducción ............................................................................... 16 1.1.2 La finalidad de la traducción ..................................................................................... 22 1.2 La traducción técnica ................................................................................................. 24 1.2.1 Definición del texto técnico ....................................................................................... 26 1.2.2 Características específicas de la traducción técnica .................................................. 28 1.3 Problemas de la traducción ........................................................................................ 30 1.3.1 Los problemas de la traducción según Nord ............................................................. 31 1.3.2 Los problemas de la traducción según Krings ........................................................... 35 1.3.3 Los problemas de la traducción según Schmitt ......................................................... 36 1.3.4 Los problemas de la traducción según Hurtado ......................................................... 38 1.4 Errores en la traducción ............................................................................................. 40 1.4.1 La clasificación de errores de traducción según Nord ............................................... 41 1.4.2 La clasificación de los errores de traducción según Hurtado .................................... 42 1.4.3 La clasificación de los errores de traducción según Schmitt ..................................... 43 1.5 Problemas de traducción en la combinación lingüística alemán-castellano .............. 47 1.5.1 Problemas pragmáticos .............................................................................................. 48 1.5.2 Problemas culturales .................................................................................................. 49 1.5.3 Problemas en el uso y aplicación de convenciones ................................................... 50 1.5.4 Problemas lingüísticos ............................................................................................... 53 1.6 Conclusiones del capítulo .......................................................................................... 72 2. Tecnologías de la traducción, traducción automática y sus problemas ..................... 73 v Índice 2.1 Traducción asistida por ordenador ............................................................................ 76 2.2 La traducción automática ........................................................................................... 79 2.2.1 Sistemas de traducción automática basados en reglas ............................................... 81 2.2.2 Sistemas basados en datos o corpus .......................................................................... 85 2.2.3 Sistemas de traducción automática basados en redes neuronales .............................. 98 2.2.4 Problemas y errores se presentan en la traducción automática ................................. 99 2.2.5 Métodos de evaluación de la calidad de la traducción automática .......................... 140 2.3 Conclusiones del capítulo ........................................................................................ 171 3. Posedición ................................................................................................................ 173 3.1 Definición ................................................................................................................ 173 3.2 Tipos de posedición ................................................................................................. 175 3.3 Niveles de posedición .............................................................................................. 176 3.4 Reglas de posedición ............................................................................................... 178 3.4.1 Reglas para la posedición de TAUS ........................................................................ 179 3.4.2 Directrices de posedición para GALE ..................................................................... 181 3.4.3 Directrices dependiendo del tipo de posedición ...................................................... 182 3.5 Métodos de evaluación del trabajo de posedición ................................................... 185 3.5.1 Medición del esfuerzo cognitivo ............................................................................. 186 3.5.2 Medición del esfuerzo en parámetros de tiempo ..................................................... 187 3.5.3 Medición del esfuerzo técnico ................................................................................. 187 3.6 Herramientas ............................................................................................................ 188 3.7 Conclusiones del capítulo ........................................................................................ 189 4. Conclusiones de la primera parte ............................................................................. 190 PARTE II: MARCO METODOLÓGICO.............................................................................. 201 5. Presentación de los objetivos ................................................................................... 202 5.1 Objetivos .................................................................................................................. 202 5.2 Aplicación de sistemas de medición de la calidad como instrumento de investigación: el caso de MQM ............................................................................... 204 5.2.1 Definición de calidad y errores en MQM ................................................................ 205 5.2.2 Tipos de errores ....................................................................................................... 206 5.2.3 Scoring ..................................................................................................................... 207 vi Índice 5.2.4 Utilización de MQM ................................................................................................ 208 5.2.5 Cómo crear una métrica con MQM ......................................................................... 208 6. Descripción del corpus y de las herramientas de análisis ........................................ 214 6.1 Descripción del corpus ............................................................................................ 214 6.1.1 Estructura del corpus extraído de TaraXŰ .............................................................. 217 6.1.2 Reorganización de los datos del corpus ................................................................... 220 6.2 Herramientas adicionales utilizadas ........................................................................ 224 6.2.1 Árboles de decisiones .............................................................................................. 225 6.2.2 translate5 .................................................................................................................. 228 7. Análisis preliminar del corpus y descripción de los motores de traducción ........... 232 7.1 Categorización de los errores .................................................................................. 234 7.2 Problemas y errores encontrados en los segmentos originales ................................ 236 7.3 Tipos de errores encontrados en las traducciones ................................................... 238 7.3.1 Descripción global de los errores en las traducciones ............................................. 238 7.3.2 Tipos de errores según categorías gramaticales ...................................................... 246 7.4 Errores encontrados según el motor empleado ........................................................ 255 7.4.1 Errores encontrados en las propuestas del motor SMT1 ......................................... 255 7.4.2 Errores encontrados en las propuestas del motor SMT2 ......................................... 257 7.4.3 Errores encontrados en las propuestas del motor RBMT1 ...................................... 259 7.4.4 Errores que se encuentran en las propuestas del motor RBMT2 ............................. 261 7.5 Comparación de los sistemas ................................................................................... 264 7.6 Análisis de las traducciones con ayuda de la distancia de teclado (Levenshtein) ... 265 7.7 Errores presentes en el corpus según las categorías de MQM................................. 268 7.7.1 Errores encontrados en la categoría Accuracy ........................................................ 268 7.7.2 Errores encontrados en la categoría Design ............................................................ 272 7.7.3 Errores encontrados en la categoría Fluency ........................................................... 274 7.7.4 Errores encontrados en la categoría Internationalization ........................................ 277 7.7.5 Errores encontrados en la categoría Locale convention .......................................... 278 7.7.6 Errores encontrados en la categoría Style ................................................................ 278 7.7.7 Errores encontrados en la categoría Terminology ................................................... 279 7.7.8 Errores encontrados en la categoría Verity .............................................................. 280 7.8 Conclusiones del primer análisis ............................................................................. 281 vii
Description: