Table Of ContentLENGUAJE
CONTROLADOAPLICADO A LA
TRADUCCIÓNAUTOMÁTICA DE
PROSPECTOSFARMACÉUTICOS
Ángel Luis Seoane Vicente
Universidad de Alicante
LENGUAJE
CONTROLADO
APLICADO A LA
TRADUCCIÓN
AUTOMÁTICA DE
PROSPECTOS
FARMACÉUTICOS
Ángel Luis Seoane Vicente
Tesis doctoral
Alicante, noviembre de 2015
Departamento de Traducción e Interpretación
Facultad de Filosofía y Letras
LENGUAJE CONTROLADO
APLICADO A LA TRADUCCIÓN
AUTOMÁTICA DE PROSPECTOS
FARMACÉUTICOS
ÁNGEL LUIS SEOANE VICENTE
Tesis presentada para aspirar al grado de
DOCTOR POR LA UNIVERSIDAD DE ALICANTE
Programa de Doctorado en Traducción e Interpretación
Dirigida por:
JAVIER FRANCO AIXELÁ
Profesor Titular de Universidad. Departamento de Traducción e
Interpretación
RESUMEN
Esta tesis doctoral surge del interés por establecer un método pautado de
creación de lenguajes controlados para su aplicación en la traducción automática de
géneros textuales específicos.
Nuestro método parte del estudio de las dificultades que el sistema Google
Translator Toolkit encuentra al traducir prospectos farmacéuticos del inglés al español
peninsular. Una vez halladas las dificultades y definidas las reglas del lenguaje
controlado, traducimos, en idénticas condiciones, los textos controlados a fin de
contrastar los resultados con los obtenidos en la traducción inicial no controlada.
El objetivo general se basa en la hipótesis de trabajo siguiente: «Los lenguajes
controlados contribuyen a incrementar la calidad de los textos traducidos mediante
sistemas de traducción automática». En este sentido, el trabajo cubre una laguna
presente en abundante bibliografía sobre la cuestión, puesto que apenas se han descrito
estudios empíricos con el nivel de detalle que planteamos, tanto en la descripción
rigurosa de la metodología empleada como en la evaluación cuantitativa y estadística de
la posible mejora de la calidad de los textos obtenidos en lengua meta.
Parece conveniente acotar el experimento a un género textual a fin de
incrementar las posibilidades de éxito, dada la reducción de las opciones lingüísticas y
de las interpretaciones semánticas del léxico que éstos aportan. Los prospectos de
medicamentos se presentan como un primer candidato idóneo para nuestro estudio,
gracias al volumen importante de léxico y de macroestructuras textuales que se repiten.
Además, la elección del género de los prospectos se muestra especialmente
interesante, dado que éstos viven en la actualidad un proceso de simplificación del
registro hasta un nivel de habla informal, tras muchos años de sujeción a un registro
culto. Dicho proceso se inscribe en una tendencia general de simplificación de la prosa
ydel mensaje.
Después de aplicar las distintas fases de nuestro método, los resultados son
concluyentes en apoyar la hipótesis de partida. Además, nos revelan, por una parte,
cómo influyen las normas del lenguaje controlado sobre los textos meta y, por otra, qué
tipos de normas son más eficaces en una primera aproximación, si bien observamos que
no es posible determinar la eficacia de una norma concreta cuando se aplica en conjunto
con otras normas. Entre las áreas que ofrecen un mejor rendimiento, encontramos
aquellas relacionadas con la restitución de elementos gramaticales omitidos, la
modificación del léxico y de la puntuación, la simplificación de sintagmas nominales
complejos y la explicitación de la anáfora.
En general, podemos concluir que el uso de lenguajes controlados es positivo si
se cumplen los requisitos operativos de partida que hemos empleado en nuestro estudio:
de un lado, un sistema de traducción automática estadístico muy potente; del otro, un
género textual donde abundan las estructuras sintácticas y las frases prefijadas.
***
This study builds on our interest in establishing a clearcut model for applying
controlled languages to the machine translation of specifc genres.
Our methodology begins by defining the difficulties found by the machine
translation (MT) tool employed, Google Translator Toolkit, in translating patient
information leaflets (PILs) from English to European Spanish. Having defined those
difficulties and the rules of our controlled language, we introduce the controlled sample
in the MT tool so as to compare results with the original non-controlled translation. We
measure theimprovement in quality of the output by using a metric of our own devise.
Our assumption is «that controlled languages help to increase the quality of texts
translated by MT tools». Our work covers a gap existing in the field, since there are
very few studies fully detailing the methodology and the statistical assessment of the
improvement obtained by using MT. Thus, a major part of our study consists in
presenting empirical and quantitative data to support the actual efficiency of controlled
languages.
It seems convenient to limit the experiment to a text-genre in order to improve
the chances of success, due to the reduction of language options and semantic
interpretations of the lexicon found in diverse genres. PILs seem good candidates for
this purpose, thanks to the high rate of iteration in their lexical and textual
macrostructures. Besides, the choice of PILs is reinforced by the simplifying process to
oral-speech level they are undergoing these days from their previous submission to
learned registers. This process is inscribed in a general trend to simplify prose and
discourse.
After applying the different stages of our experiment, results support the initial
assumption. Other findings show the impact of controlled language rules on the
translated texts and the most efficient types of rules. These seem to relate to the
restitution of omitted grammar words, the modification of lexicon and orthography, the
simplification of complex noun phrases and the clarification of anaphoric elements.
However, we find that it is impossible to determine the efficiency of one given rule
when it is applied within a set of rules.
In general, we can conclude that the use of controlled languages is positive
provided that operating conditions similar to ours are implemented: a robust statistical
machine translation system and a genre showing repetition of syntactic structures and
coined phrases.
ÍNDICE
Resumen
Índice
Índice de Ilustraciones
Listado de Abreviaturas
Agradecimientos
***
INTRODUCCIÓN.......................................................................................1
PARTE PRIMERA. ENTORNO CONCEPTUAL
1. CAPÍTULO PRIMERO. LENGUAJES CONTROLADOS. UNA
REVISIÓN............................................................................................12
1.1DEFINICIÓN DE LENGUAJE CONTROLADO...............................................13
1.1.1 DOS VISIONES DE UN MISMO CONCEPTO................................................13
1.1.2 PROPUESTA DE DEFINICIÓN........................................................................14
1.2REVISIÓN HISTÓRICA DE LENGUAJES CONTROLADOS........................16
1.2.1 BASIC ENGLISH DE OGDEN (1930), EL PIONERO.....................................16
1.2.1.1REGLAS Y OPERADORES..............................................................................17
1.2.1.2EJEMPLO DE TRADUCCIÓN AL BASIC ENGLISH.....................................17
1.2.1.3CRÍTICA.............................................................................................................18
1.2.2 CATERPILLAR FUNDAMENTAL ENGLISH Y CATERPILLAR
TECHNICAL ENGLISH (1971-1990)...............................................................19
1.2.3 AEROSPACE AND DEFENCE INDUSTRIES ASSOCIATION OF EUROPE
(ASD) SIMPLIFIED TECHNICAL ENGLISH (1986)......................................22
Description:14. La segunda definición («variedades de uso o variaciones lingüísticas restrictivas») .. and Defence Industries Association of Europe 2013:1-1-10) . The Highlands of Scotland consist of lakes,mountains and moors. The En cuanto a la traducción propiamente dicha, Wycliffe Associates se inscr