• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Google se vuelve más multilingüe, pero ¿obtendrá los matices?

    Un estudiante colorea un zorro durante una clase de idioma indígena quechua que se enfoca en los nombres de los animales en una escuela primaria pública en Licapa, Perú, el miércoles 1 de septiembre de 2021. Cerca de 10 millones de personas hablan quechua, pero intentan traducir automáticamente correos electrónicos y mensajes de texto. en la familia de lenguas indígenas más hablada en las Américas era casi imposible antes de que Google la introdujera en su servicio de traducción digital el miércoles 11 de mayo de 2022. El gigante de Internet dice que la nueva tecnología de inteligencia artificial le está permitiendo expandir enormemente el repertorio de Google Translate de las lenguas del mundo. idiomas, agregando 24 más esta semana, incluido el quechua y otros idiomas indígenas sudamericanos como el guaraní y el aymara. Crédito:AP Photo/Martin Mejia, Archivo

    Alrededor de 10 millones de personas hablan quechua, pero tratar de traducir automáticamente correos electrónicos y mensajes de texto a la familia de lenguas indígenas más hablada en las Américas fue casi imposible durante mucho tiempo.

    Eso cambió el miércoles, cuando Google agregó quechua y una variedad de otros idiomas a su servicio de traducción digital.

    El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite expandir enormemente el repertorio de idiomas del mundo de Google Translate. Agregó 24 de ellos esta semana, incluidos el quechua y otras lenguas indígenas sudamericanas como el guaraní y el aymara. También está agregando una serie de idiomas africanos y del sur de Asia ampliamente hablados que faltaban en los productos tecnológicos populares.

    "Observamos idiomas con poblaciones muy grandes y desatendidas", dijo a los periodistas el científico investigador de Google, Isaac Caswell.

    Las novedades de la exhibición anual de tecnología de E/S de la compañía de California pueden celebrarse en muchos rincones del mundo. Pero también generará críticas de aquellos frustrados por productos tecnológicos anteriores que no entendieron los matices de su idioma o cultura.

    El quechua era la lengua franca del Imperio Inca, que se extendía desde lo que ahora es el sur de Colombia hasta el centro de Chile. Su estatus comenzó a declinar tras la conquista española de Perú hace más de 400 años.

    Agregarlo a los idiomas reconocidos por Google es una gran victoria para los activistas del idioma quechua como Luis Illaccanqui, un peruano que creó el sitio web Qichwa 2.0, que incluye diccionarios y recursos para aprender el idioma.

    "Ayudará a poner al quechua y al español en el mismo estatus", dijo Illaccanqui, quien no participó en el proyecto de Google.

    Illaccanqui, cuyo apellido en quechua significa "tú eres el rayo", dijo que la traductora también ayudará a mantener vivo el idioma con una nueva generación de jóvenes y adolescentes, "que hablan quechua y español al mismo tiempo y les fascina redes sociales."

    La maestra Carmen Cazorla escribe en el idioma indígena quechua durante una clase sobre plantas medicinales en una escuela primaria pública en Licapa, Perú, el miércoles 1 de septiembre de 2021. Cerca de 10 millones de personas hablan quechua, pero intentan traducir automáticamente correos electrónicos y mensajes de texto a la familia de lenguas indígenas más hablada en las Américas era casi imposible antes de que Google la introdujera en su servicio de traducción digital el miércoles 11 de mayo de 2022. El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite expandir enormemente el repertorio de idiomas del mundo de Google Translate , agregando 24 más esta semana, incluido el quechua y otras lenguas indígenas sudamericanas como el guaraní y el aymara. Crédito:AP Photo/Martin Mejia

    Caswell calificó la noticia como un "gran avance tecnológico" porque, hasta hace poco, no era posible agregar idiomas si los investigadores no podían encontrar un tesoro de texto en línea lo suficientemente grande, como libros digitales, periódicos o publicaciones en redes sociales, para sus necesidades. Sistemas de IA de los que aprender.

    Los gigantes tecnológicos de EE. UU. no tienen un gran historial de hacer que su tecnología lingüística funcione bien fuera de los mercados más ricos, un problema que también les dificulta detectar información errónea peligrosa en sus plataformas. Hasta esta semana, el Traductor de Google se ofrecía en idiomas europeos como el frisón, el maltés, el islandés y el corso, cada uno con menos de 1 millón de hablantes, pero no en idiomas de África oriental como el oromo y el tigrinya, que tienen millones de hablantes.

    Los nuevos idiomas se implementarán esta semana. Todavía no serán entendidos por el asistente de voz de Google, que por ahora los limita a traducciones de texto a texto. Google dijo que está trabajando para agregar reconocimiento de voz y otras capacidades, como ser capaz de traducir un letrero apuntándolo con una cámara.

    Eso será importante para los idiomas mayoritariamente hablados como el quechua, especialmente en el campo de la salud, porque muchos médicos y enfermeras peruanos que solo hablan español trabajan en áreas rurales y "no pueden entender a los pacientes que hablan principalmente quechua", dijo Illaccanqui.

    "La próxima frontera, o desafío, es trabajar en el habla", dijo Arturo Oncevay, investigador peruano de traducción automática de la Universidad de Edimburgo, quien cofundó una coalición de investigación para mejorar la tecnología de los idiomas indígenas en las Américas. "Las lenguas nativas de las Américas son tradicionalmente orales".

    En su anuncio, Google advirtió que la calidad de las traducciones en los idiomas recién agregados "todavía está muy por detrás" de otros idiomas que admite, como inglés, español y alemán, y señaló que los modelos "cometerán errores y exhibirán sus propios sesgos". " Pero la empresa solo agregó idiomas si sus sistemas de IA alcanzaron un cierto umbral de competencia, dijo Caswell.

    "Si hay un número significativo de casos en los que está muy mal, entonces no lo incluiríamos", dijo. "Incluso si el 90 % de las traducciones son perfectas, pero el 10 % son tonterías, eso es demasiado para nosotros".

    Google dijo que sus productos ahora admiten 133 idiomas. Los últimos 24 son el lote individual más grande que se agregó desde que Google incorporó 16 nuevos idiomas en 2010. Lo que hizo posible la expansión es lo que Google llama un modelo de traducción automática de "disparo cero" o "recurso cero", uno que aprende a traducir a otro idioma sin ver nunca un ejemplo de ello.

    La empresa matriz de Facebook e Instagram, Meta, introdujo un concepto similar llamado Universal Speech Translator el año pasado.

    Libros escritos en el idioma indígena quechua se sientan detrás de un estudiante durante una clase sobre plantas medicinales, en una escuela primaria pública en Licapa, Perú, el miércoles 1 de septiembre de 2021. Cerca de 10 millones de personas hablan quechua, pero intentan traducir automáticamente los correos electrónicos y era casi imposible enviar mensajes de texto a la familia de lenguas indígenas más hablada en las Américas antes de que Google la introdujera en su servicio de traducción digital el miércoles 11 de mayo de 2022. El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite expandir enormemente el repertorio de Google Translate los idiomas del mundo, agregando 24 más esta semana, incluido el quechua y otros idiomas indígenas sudamericanos como el guaraní y el aymara. Crédito:AP Photo/Martin Mejia

    El modelo de Google funciona entrenando un "modelo de IA neuronal gigante único" en aproximadamente 100 idiomas ricos en datos y luego aplicando lo aprendido a cientos de otros idiomas que no conoce, dijo Caswell. "Imagínate si eres un gran políglota y luego comienzas a leer novelas en otro idioma, puedes comenzar a reconstruir lo que podría significar en función de tu conocimiento del idioma en general", dijo.

    Dijo que el nuevo grupo abarca desde idiomas más pequeños como el mizo, hablado en el noreste de la India por unas 800 000 personas, hasta idiomas más hablados como el lingala, hablado por unos 45 millones de personas en África Central.

    Fue hace más de 15 años, en 2006, que Microsoft obtuvo una atención positiva en América del Sur con una función de software que traducía menús y comandos familiares de Microsoft al quechua. Pero eso fue antes de la ola actual de avances de IA en la traducción en tiempo real.

    El erudito en idiomas de la Universidad de Harvard, Américo Mendoza-Mori, que habla quechua, dijo que conseguir la atención de Google brinda cierta visibilidad necesaria al idioma en lugares como Perú, donde los hablantes de quechua todavía carecen de muchos servicios públicos. La supervivencia de muchos de estos idiomas "dependerá de su uso en contextos digitales", dijo.

    Otro erudito en idiomas, Roberto Zariquiey, dijo que es escéptico de que Google pueda ser una herramienta efectiva para revitalizar el idioma quechua, aymara o guaraní sin una participación más cercana de los grupos comunitarios de la región.

    “Los idiomas están profundamente ligados a la vida, a las culturas, a las etnias y organizaciones políticas”, dijo Zariquiey, lingüista de la Pontificia Universidad Católica del Perú. "Esto debe tenerse en cuenta".

    —-

    Los nuevos idiomas agregados son:asamés, aymara, bambara, bhojpuri, dhivehi, dogri, ewe, guaraní, ilocano, konkani, krio, lingala, luganda, maithili, meiteilon (manipuri), mizo, oromo, quechua, sánscrito, sepedi, sorani Kurdo, Tigrinya, Tsonga y Twi.

    © Ciencia https://es.scienceaq.com