Las redes sociales como Facebook buscan una traducción automática eficiente para todos los idiomas del mundo y la inteligencia artificial puede tener la respuesta.
Los diseñadores de herramientas de traducción automática todavía se basan principalmente en diccionarios para hacer comprensible un idioma extranjero. Pero ahora hay una nueva forma:los números.
Los investigadores de Facebook dicen que convertir las palabras en cifras y explotar las similitudes matemáticas entre los idiomas es una vía prometedora, incluso si un comunicador universal a la Star Trek sigue siendo un sueño lejano.
La traducción automática eficaz es una gran prioridad para los gigantes de Internet. Permitir que la mayor cantidad posible de personas en todo el mundo se comuniquen no es solo un objetivo altruista, pero también un buen negocio.
Facebook, Google y Microsoft, así como Yandex de Rusia, Baidu de China y otros países buscan constantemente mejorar sus herramientas de traducción.
Facebook tiene expertos en inteligencia artificial trabajando en uno de sus laboratorios de investigación en París.
Actualmente se utilizan hasta 200 idiomas en Facebook, dijo Antoine Bordes, Codirector europeo de investigación fundamental en IA para la red social.
La traducción automática se basa actualmente en tener grandes bases de datos de textos idénticos en ambos idiomas para trabajar. Pero para muchos pares de idiomas simplemente no hay suficientes textos paralelos.
Es por eso que los investigadores han estado buscando otro método, como el sistema desarrollado por Facebook que crea una representación matemática de palabras.
Cada palabra se convierte en un "vector" en un espacio de varios cientos de dimensiones. Las palabras que tienen asociaciones cercanas en el lenguaje hablado también se encuentran cerca unas de otras en este espacio vectorial.
¿De vasco a amazónico?
"Por ejemplo, si toma las palabras 'gato' y 'perro', semánticamente, son palabras que describen algo parecido, por lo que estarán extremadamente juntos físicamente "en el espacio vectorial, dijo Guillaume Lample, uno de los diseñadores del sistema.
"Si tomas palabras como Madrid, Londres, París, que son las capitales europeas, es la misma idea ".
Estos mapas de idiomas se pueden vincular entre sí mediante algoritmos, al principio aproximadamente, pero eventualmente volviéndose más refinado, hasta que las frases completas puedan coincidir sin demasiados errores.
Lample dijo que los resultados ya son prometedores.
Para el par de idiomas inglés-rumano, El sistema de traducción automática actual de Facebook es "igual o quizás un poco peor" que el sistema de vectores de palabras, dijo Lample.
Pero para el par de idiomas más raro de inglés-urdu, donde el sistema tradicional de Facebook no tiene muchos textos bilingües para hacer referencia, la palabra sistema de vectores ya es superior, él dijo.
Pero, ¿podría el método permitir la traducción de decir, ¿Vasco a la lengua de una tribu amazónica?
En teoria, sí, dijo Lample, pero en la práctica se necesita una gran cantidad de textos escritos para mapear el idioma, algo que falta en las lenguas tribales amazónicas.
"Si solo tiene decenas de miles de frases, no funcionará. Necesita varios cientos de miles, " él dijo.
'Santo Grial'
Los expertos del centro científico nacional CNRS de Francia dijeron que el enfoque que Lample ha adoptado para Facebook podría producir resultados útiles. incluso si no resulta en traducciones perfectas.
Thierry Poibeau del laboratorio Lattice del CNRS, que también investiga sobre traducción automática, llamó a la palabra enfoque vectorial "una revolución conceptual".
Dijo que "traducir sin datos paralelos" —diccionarios o versiones de los mismos documentos en ambos idiomas— "es algo del Santo Grial" de la traducción automática.
"Pero la pregunta es qué nivel de rendimiento se puede esperar" del método de vector de palabras, dijo Poibeau.
El método "puede dar una idea del texto original", pero la capacidad para una buena traducción sigue sin demostrarse.
Francois Yvon, investigador del Laboratorio de Ciencias de la Computación para Ciencias Mecánicas e Ingeniería del CNRS, dijo que "la vinculación de lenguas es mucho más difícil" cuando están muy alejadas unas de otras.
"La forma de denotar conceptos en chino es completamente diferente a la del francés, "añadió.
Sin embargo, incluso las traducciones imperfectas pueden ser útiles, dijo Yvon, y podría resultar suficiente para realizar un seguimiento del discurso del odio, una de las principales prioridades de Facebook.
© 2019 AFP