• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Cómo enseñar a la IA a hablar galés (y otros idiomas minoritarios)

    Ydych chi'n siarad Cymraeg? Crédito:Golden Sikorka / Shutterstock

    Las tecnologías pioneras para el hogar inteligente y los asistentes de voz no lo hacen, como una regla, hablan galés, aunque el gobierno galés ahora tiene como objetivo cambiar eso a través de su Plan de acción de tecnología del idioma galés. Pero, ¿es factible su objetivo? es necesario, y como se puede hacer

    Las herramientas de voz de IA (como los Pixelbuds de Google) dependen en gran medida del uso de grandes conjuntos de datos para aprender un idioma, su pronunciación, gramática y semántica. La capacidad o calidad de las herramientas resultantes está principalmente limitada por la cantidad de datos disponibles (y cuán "buenos" son). Esto significa que, en teoría al menos, Las herramientas para una lengua minoritaria como el galés no pueden llegar a ser tan capaces como las de una lengua corriente.

    Los idiomas con cantidades limitadas de buenos datos de capacitación disponibles se denominan idiomas de "bajos recursos". Comparado con el inglés, Los recursos galeses son escasos, pero hay varios miles de idiomas con menos hablantes, y probablemente recursos mucho más pobres, que galés.

    Afortunadamente, se están realizando buenas investigaciones sobre una técnica de aprendizaje automático llamada "aprendizaje por transferencia". Esto permite que los sistemas aprendan utilizando un conjunto de datos y luego apliquen este conocimiento en otro. En China se utiliza para el reconocimiento automático de voz (ASR) de tibetano, que prácticamente no tiene datos disponibles para la formación. El sistema ASR aprendió chino, que es lingüísticamente muy diferente al tibetano, y luego fue reentrenado o perfeccionado para "entender" el tibetano. En realidad, hay muchos puntos en común entre muchos idiomas (palabras compartidas o prestadas y patrones de pronunciación) que ayudan a este tipo de técnica.

    Reentrenamiento de la IA en galés

    Por lo tanto, no hay ninguna razón por la que los sistemas de inteligencia artificial no puedan producirse para conversar en galés u otros idiomas minoritarios. Pero, ¿hay alguna razón por la que debería hacerlo? Toda la tecnología del habla, Los hogares inteligentes y los sistemas de interacción de voz que se utilizan hoy en día son el producto de la investigación comercial. Para decirlo sin rodeos, existen para ganar dinero con sus datos, para venderte más bienes y servicios, o para influir en su pensamiento. Nada de esta IA existe para el bien público.

    Hacer un sistema que funcione bien con galés puede no ser tan fácil como diseñar todo en inglés. Con la tecnología actual, Se necesitarán expertos en inteligencia artificial del habla (y somos caros). Habrá necesidad de material de prueba y formación en galés, y los probadores de habla galés deben participar. Los peligros de no involucrar a hablantes de galés en el proceso de traducción se han demostrado ampliamente en el pasado. cuando una respuesta por correo electrónico fuera de la oficina terminó en una señal de tráfico

    A menos que exista un argumento económico suficientemente sólido, no espere que las grandes empresas se apresuren a producir galés, Sistemas de habla gaélico o de Cornualles. Incluso el gigante tecnológico Samsung aún no ha logrado producir una versión de habla inglesa del Reino Unido de su asistente Bixby (los hablantes de inglés internacionales deben hablar con él con acentos estadounidenses falsos para que funcione). Incluso la versión en inglés de EE. UU. Se retrasó debido a la falta de recursos.

    Y siempre que los hablantes de galés estén felices de hacer uso de los sistemas de inteligencia artificial en inglés, Puede que no haya un argumento económico, a menos que el gobierno galés decida pagar para que esto suceda, lo que no ha hecho hasta ahora (el plan de acción es un "compromiso" en esta etapa).

    IA al rescate

    La tecnología avanza y técnicas como el aprendizaje por transferencia son cada día más capaces. Esto ha permitido que la investigación previa sobre la adaptación del lenguaje se actualice y se extienda al desarrollo de técnicas de aprendizaje profundo en varios idiomas. Mientras tanto, El uso cada vez mayor de otros tipos de tecnología digital por parte de los hablantes de galés ha mejorado la recopilación de recursos en el idioma, al igual que la televisión y la radio galesas. Estos avances significan que se está reduciendo el costo de localizar sistemas para galés (y otros idiomas minoritarios).

    La investigación sobre algoritmos de aprendizaje similares al cerebro puede ser la clave aquí. Esta es una tecnología que puede aprender continuamente durante el uso, al igual que los humanos aprenden a hablar un nuevo idioma. A diferencia de la mayoría de los sistemas de IA actuales que se entrenan en el laboratorio, antes de ser liberado en la naturaleza, salvo algunas excepciones, algunos, como Tay de Microsoft, notable por sus espectaculares fracasos. Los sistemas futuros podrán adquirir gradualmente habilidades en un segundo idioma simplemente haciendo que los usuarios introduzcan gradualmente más y más de ese idioma en sus interacciones diarias. En lugar de financiar la investigación sobre la inteligencia artificial del habla galesa, El gobierno de Gales podría hacerlo mejor respaldando la investigación de este nuevo tipo de tecnología de aprendizaje adaptativo.

    Debido a que todos los sistemas actuales de inteligencia artificial del habla manejan el habla de forma centralizada (no se hace en el dispositivo, pero en una granja de servidores remota), Estos sistemas podrían recopilar datos de cientos de usuarios en todo el mundo (o en todo Gales) para aprender rápidamente. Por lo tanto, el mensaje para los hablantes de galés de hoy puede ser que no compren ese Google Home o Amazon Alexa en inglés si desea que Google o Amazon produzcan un sistema que funcione en galés. Pero si tienes uno, a medida que su software se desarrolle en los próximos años, intente hablarle en galés tanto como sea posible. Puede que te sorprenda a ti ya Siaradwch â chi yn Gymraeg.

    Este artículo se ha vuelto a publicar de The Conversation con una licencia de Creative Commons. Lea el artículo original.




    © Ciencia https://es.scienceaq.com