El aprendizaje automático mediante inteligencia artificial ha mejorado la traducción informática durante la última década, pero los artículos científicos que emplean jerga especializada siguen siendo un desafío para la traducción automática. Sin embargo, los científicos deberían priorizar la traducción de artículos a varios idiomas para proporcionar un panorama equitativo para los científicos en ciernes de todo el mundo, argumentan los investigadores de UC Berkeley. Crédito:Valeria Ramírez-Castañeda, UC Berkeley
Mientras aún estaba en la escuela secundaria, Xinyi Liu trabajó brevemente en un laboratorio en la Universidad de Beihang en Beijing y se sorprendió al ver que los investigadores chinos usaban Google Translate de manera rutinaria para generar el primer borrador en inglés de artículos científicos. La traducción es imprescindible si los científicos quieren enviar artículos a revistas de alto perfil, la mayoría de las cuales están en inglés.
"Era normal que los posdoctorados usaran Google Translate primero para traducir todo y luego modificarlo y pulirlo. Pero después de la primera traducción, todo el documento no tenía sentido", dijo Liu, estudiante de tercer año en la Universidad de California. , Berkeley, que se especializa en biología molecular y celular. "Literalmente, todas las palabras, todos los términos se juntaron al azar".
Tenía que haber una mejor manera, pensó.
Así que el año pasado, cuando vio un nuevo seminario impartido por Rebecca Tarvin sobre romper las barreras del idioma en la ciencia, se inscribió.
Esa clase, que se impartirá en UC Berkeley por tercera vez en la primavera de 2023, fue un globo de prueba para Tarvin, profesor asistente de biología integradora. Con un interés renovado en todo el campus en la diversidad, la equidad y la inclusión, ella y los grupos de trabajo dentro de su departamento pensaron que la clase podría ayudar a UC Berkeley a abordar un problema científico de larga data:el inglés, el idioma dominante de la ciencia, es un obstáculo importante para científicos que no son hablantes nativos de inglés.
No son solo los estudiantes y científicos extranjeros los que están en desventaja cuando la ciencia se comunica principalmente en inglés. También lo son muchos estudiantes nacidos en Estados Unidos. En el otoño de 2020, aproximadamente el 40 % de los estudiantes de primer año que ingresaron a UC Berkeley eran estudiantes universitarios de primera generación, y dentro del sistema de 10 campus de la Universidad de California, el 39 % de los estudiantes de primera generación crecieron con un idioma distinto al inglés como primer idioma.
"Muchos de nuestros estudiantes de California crecieron traduciendo para sus padres", dijo Tarvin. "La traducción ha sido parte de su vida desde que eran muy jóvenes".
Para Tarvin, la clase, Rompiendo las barreras del lenguaje en la evolución y la ecología, fue una "oportunidad tanto para enseñar a los estudiantes habilidades en la alfabetización traductora, como para animar a los estudiantes a ser activistas en este ámbito de cambio estructural. Y, de hecho, he visto un una recepción realmente positiva de este tipo de activismo por parte de los estudiantes, ya que todos parecen estar de acuerdo en que abordar las barreras del idioma es realmente importante después de realizar el curso".
La clase llevó a Tarvin y a algunos estudiantes de posgrado de UC Berkeley, junto con colaboradores en Canadá, Israel y Hungría, a escribir un artículo científico que evalúe las nuevas herramientas de traducción automática que pueden usar personas de todo el mundo para hacer que sus artículos científicos sean accesibles para personas que no hablan inglés. . El artículo apareció en línea este mes en la revista BioScience . Las traducciones al español, francés, portugués y húngaro, los idiomas de los coautores, también están en línea.
"La idea aquí es que estamos tratando de darles a las personas las herramientas y la motivación para traducir su propia investigación científica", dijo Tarvin. "La ciencia no necesita basarse en un solo idioma. Y hay muchos beneficios adicionales que se derivan de la incorporación de enfoques multilingües en cada fase de la ciencia. Por ejemplo, publicar en varios idiomas beneficiará a la sociedad debido a una mejor comunicación científica".
"El idioma puede ser una barrera, además de una herramienta fantástica, para unir a las personas", enfatizó Emma Steigerwald, primera autora del artículo y estudiante de posgrado en ciencias, políticas y gestión ambiental de UC Berkeley. "Es una barrera que podemos superar usando esta nueva tecnología. Explicamos sobre la tecnología y cómo se puede implementar y las cosas que debemos tener en cuenta cuando usamos la tecnología, y todas las formas maravillosas y positivas en que la comunicación científica pueden transformarse aplicando esta nueva tecnología".
Hacia una red científica multilingüe
Hasta hace poco, la traducción por computadora era el blanco de las bromas. Las personas compartieron ejemplos divertidos de errores de traducción, que a menudo parecían menospreciar otros idiomas además del inglés y, por implicación, otras culturas.
Pero el aprendizaje automático, o inteligencia artificial, ha aumentado drásticamente la precisión de la traducción hasta el punto de que los turistas utilizan servicios de Internet como Google Translate para comunicarse con las personas en los países que visitan.
Pero para el texto que contiene mucha jerga (mucha de ella científica, pero también de muchos otros campos académicos), Google Translate es lamentablemente inadecuado.
"La calidad de la traducción no es para una revista", dijo Ixchel González Ramírez, una de las mentoras de estudiantes de posgrado del curso. "Muchas veces, las personas tienen que pagar para que un traductor profesional traduzca su trabajo, y eso es muy costoso".
El nuevo documento destaca algunos de los numerosos servicios, la mayoría de ellos gratuitos, que pueden convertir la escritura científica en inglés a otros idiomas. Además de la conocida plataforma Google Translate, estas incluyen DeepL, que utiliza redes neuronales y afirma ser muchas veces más precisa que la competencia al traducir del inglés al chino, japonés, lenguas romances o alemán, y viceversa; Baidu Translate, un servicio de la empresa de Internet china Baidu que inicialmente se centró en traducir entre inglés y chino; Naver Pagago, un traductor multilingüe creado por una empresa en Corea del Sur; y Yandex.Translate, que usa traducción automática estadística y se enfoca principalmente en ruso e inglés.
"La traducción está cada vez más al alcance de cualquier persona. Ya sea que sea un experto o no, e incluso que sea bilingüe o no, la capacidad de traducir es tan acelerada por muchas de las tecnologías que tenemos disponibles en la actualidad". Steigerwald dijo. "Entonces, ¿cómo podemos integrar esto en nuestro flujo de trabajo como científicos y cómo cambia esto las expectativas que rodean la comunicación científica?"
El aprendizaje automatizado que usa tecnologías de inteligencia artificial ha mejorado la traducción en computador en la última década. Sin embargo, los artículos científicos que utilizan terminología especializada siguen siendo un reto para la traducción automática. No obstante, la comunidad científica debería dar prioridad a la traducción de artículos en varios idiomas para ofrecer un panorama equitativo a los científicos y las científicas en formación de todo el mundo, afirman los investigadores de la UC Berkeley. Crédito:Valeria Ramírez-Castañeda, UC Berkeley
El inglés es la lingua franca de la ciencia
El interés de Tarvin por la traducción surgió de una de sus estudiantes de posgrado, Valeria Ramírez Castañeda, quien en 2020 publicó un artículo que describía los costos incurridos por sus compañeros estudiantes de doctorado colombianos que querían publicar o interactuar con colegas en un mundo dominado por el inglés.
Como bióloga evolutiva interesada en cómo algunos animales llegaron a usar veneno, Tarvin decidió enfocar su nuevo seminario en la traducción de artículos en los campos de la evolución y la ecología, aunque los estudiantes que se inscribieron eventualmente trazaron sus propios cursos. En particular, buscó estudiantes, como Liu, y mentores, como González Ramírez, que son bilingües o multilingües.
"Todos en la clase han tenido algún tipo de relación familiar con el lenguaje", dijo Tarvin.
Tarvin también le pidió a Mairi-Louise McLaughlin, profesora de francés y lingüística de UC Berkeley y experta en traducción periodística y literaria, que hablara a la clase sobre cómo los profesionales abordan la traducción y cómo la traducción afecta el significado. Ese tema resonó en los estudiantes cuando intentaron traducir resúmenes científicos y, a veces, artículos completos.
Ruoming Cui, un estudiante de segundo año en ascenso que tomó el curso en la primavera de 2022, eligió Baidu para traducir resúmenes científicos. Inmediatamente descubrió que las oraciones largas y complejas del inglés y el uso de múltiples palabras para describir un concepto parecían redundantes cuando se traducían al chino.
"Normalmente no hacemos eso en chino porque hará que cada oración sea muy larga y es muy tedioso", dijo.
Liu agregó que sin un pulido considerable, muchas traducciones al inglés se confunden, dijo.
"Escuché el dicho de que, aunque tu resultado es sorprendente, si escribes un artículo confuso debido a la traducción, la gente se molestará porque no pueden entender lo que estás haciendo", dijo Liu. "Y eso afectará en gran medida la forma en que las personas validan la investigación o incluso si la leerán. Creo que es una gran barrera en el mundo científico".
Steigerwald, Tarvin y sus coautores también se dieron cuenta de que escribir artículos científicos en un inglés más sencillo, algo que los no científicos han estado alentando durante mucho tiempo, beneficia tanto a los angloparlantes como a los que no hablan inglés.
"Si su primer idioma no es el inglés y solo está tratando de leer la versión en inglés del artículo, se sentirá mucho menos ambiguo y mucho más legible cuando el escritor haya usado un lenguaje sencillo", dijo Steigerwald. "Pero también, lo que es muy importante, cuando vaya a traducir ese fragmento de texto, las herramientas de aprendizaje automático tendrán mucho más facilidad para traducir algo que está escrito en un lenguaje sencillo. Entonces, esto es una forma de preparar su escritura para el futuro, así que que si alguien quiere traducirlo a un millón de idiomas, será mucho más fácil hacerlo cuando esté escrito de esa manera".
Siguen existiendo obstáculos para la traducción generalizada de artículos científicos, incluido dónde ponerlos a disposición y cómo lidiar con los derechos de autor. La mayoría de las revistas ni siquiera aceptan artículos que no estén en inglés, y pocas permiten explícitamente la publicación conjunta de artículos con una traducción. Tarvin descubrió que pocas revistas tienen políticas sobre las traducciones y, como resultado de las restricciones generales de derechos de autor, muchas editoriales cobran tarifas exorbitantes por publicar una traducción en línea después de la publicación.
"Es bastante asombroso cuántas revistas no te permiten publicar libremente traducciones después de la publicación, y cuán pocas tienen soporte de plataforma donde podrías tener incluso un resumen en un segundo o tercer idioma", dijo Tarvin. "Creo que una barrera importante para esto son las plataformas web; no solo las reglas de publicación y derechos de autor, sino también la funcionalidad de la plataforma".
Con el seminario Rompiendo Barreras y ahora el BioScience artículo, Tarvin y sus colegas esperan cambiar gradualmente la norma en la ciencia para traducir artículos a otros idiomas, especialmente el idioma del país donde se realizó la investigación y los idiomas de los coautores.
Y cuantas más traducciones haya, más material habrá para entrenar los sistemas de traducción automática para que hagan un mejor trabajo, aumentando gradualmente la calidad de la traducción científica.
"En mi laboratorio, estamos traduciendo gran parte de nuestra investigación, y ahora la gente del laboratorio de Emma también lo está haciendo", dijo. "Creo que compartir nuestra actitud positiva hacia esto y cómo puede marcar la diferencia para las personas ha influido en un pequeño pero creciente grupo de personas que están comenzando a incorporar la traducción en su flujo de trabajo científico".
Coautores adicionales de BioScience el artículo incluye a las estudiantes de doctorado Valeria Ramírez-Castañeda y Débora Brandt de UC Berkeley; András Báldi del Instituto de Ecología y Botánica del Centro de Investigación Ecológica en Vácrátót, Hungría; la becaria postdoctoral Julie Teresa Shapiro de la Universidad Ben-Gurion del Negev en Be'er Sheva, Israel; y Lynne Bowker, profesora de traducción e interpretación en la Universidad de Ottawa en Canadá. Facebook presenta un traductor de aprendizaje automático para 100 idiomas