• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • Por qué la gente vencerá a las máquinas en el reconocimiento del habla durante mucho tiempo

    Crédito:Pathdoc / Shutterstock.cim

    Imagina un mundo en el que Siri siempre te entiende, Google Translate funciona perfectamente, y los dos crean algo parecido a un circuito de traducción al estilo de Doctor Who. Imagínese poder comunicarse libremente donde quiera que vaya (sin tener que murmurar en francés de la escuela con su camarero parisino). Es un atractivo pero aún lejana perspectiva. Uno de los cuellos de botella para hacer avanzar esta realidad es la variación en el lenguaje, especialmente el lenguaje hablado. La tecnología no puede hacer frente a eso.

    Humanos por otra parte, son increíblemente buenos para lidiar con variaciones en el lenguaje. Somos tan buenos De hecho, que realmente tomamos nota cuando las cosas se rompen ocasionalmente. Cuando visité Nueva Zelanda, Por un tiempo pensé que la gente me llamaba "mascota, "un término cariñoso parecido al de Newcastle. Eran, De hecho, solo diciendo mi nombre, Palmadita. Mi momento aha sucedió en una cafetería ("Flat white for pet!" Me dio una pausa).

    Esta historia ilustra cómo los diferentes acentos del inglés tienen vocales ligeramente diferentes, un hecho bien conocido. Pero intentemos entender lo que sucedió cuando escuché mal la pronunciación kiwi de Pat como mascota . Existe una cierta gama de sonidos que asociamos con las vocales, igual que a o mi . Estos rangos no son absolutos. Bastante, sus límites varían, por ejemplo, entre diferentes acentos. Cuando los oyentes no se adaptan a esto, como hice yo en este caso, la correspondencia entre el sonido y el significado puede distorsionarse.

    Uno podria, laboriosamente, enseñar diferentes acentos a un sistema de reconocimiento de voz, pero la variación del acento es solo la punta del iceberg. Los sonidos de las vocales también pueden variar según nuestra edad, género, clase social, etnia, orientación sexual, nivel de intoxicación, que tan rápido estamos hablando, con quien estamos hablando, ya sea que estemos o no en un entorno ruidoso ... la lista continúa, y en.

    El quid de la cuestión

    Considere que un estudio reciente en el que participé mostró que incluso mudarse de casa (o no) puede afectar las vocales. Específicamente, existe una correlación entre cómo los hablantes del inglés del norte pronuncian la vocal en palabras como quid , y cuántas veces se han mudado en la última década. Las personas que no se han movido en absoluto tienen más probabilidades de pronunciar quid lo mismo que ladrones , que es la pronunciación tradicional del norte de inglés. Pero aquellos que se han movido cuatro veces o más tienen más probabilidades de tener vocales diferentes en las dos palabras, de manera similar en el sur de Inglaterra.

    Hay, por supuesto, nada sobre el acto de moverse que causa esto. Pero mudarse de casa varias veces se correlaciona con otros factores de estilo de vida, por ejemplo, interactuar con más personas, incluyendo personas con diferentes acentos, lo que podría influir en la forma en que hablamos.

    Otras fuentes de variación pueden tener que ver con factores lingüísticos, como la estructura de la palabra. Un ejemplo sorprendente proviene de pares de palabras como regla , que significa "dispositivo de medición" y regla , que significa "líder".

    Estas dos palabras son superficialmente idénticas, pero difieren en un nivel estructural más profundo. A regla es alguien que gobierna, como un cantante es alguien que canta, por lo que podemos analizar estas palabras como si constan de dos unidades significativas. A diferencia de, regla lo que significa que "dispositivo de medición" no se puede descomponer más.

    Nivel de superposición entre las categorías de vocales "crooks" y "crux", dependiendo del número de mudanzas de vivienda en la última década. Datos de 143 hablantes del norte de Inglaterra.

    Resulta que los dos significados de regla están asociados con una vocal diferente para muchos hablantes de inglés británico del sur, y la diferencia entre las dos palabras se ha incrementado en los últimos años:es más grande para los hablantes más jóvenes que para los de más edad. Por tanto, tanto la estructura lingüística oculta como la edad del hablante pueden afectar la forma en que pronunciamos determinadas vocales.

    Final nunca a la vista

    Esto ilustra otra propiedad importante de la variación del lenguaje:sigue cambiando. Por lo tanto, los investigadores del lenguaje tienen que revisar constantemente su comprensión de la variación, lo que a su vez requiere continuar adquiriendo nuevos datos, y actualización del análisis. La forma en que hacemos esto en lingüística está siendo revolucionada por las nuevas tecnologías, avances en el análisis de datos instrumentales, y la ubicuidad de los equipos de grabación (en 2018, El 82% de la población adulta del Reino Unido poseía un dispositivo de grabación, también conocido como teléfono inteligente).

    Los proyectos lingüísticos de hoy en día pueden beneficiarse del avance tecnológico de diversas formas. Por ejemplo, la aplicación English Dialects recopila grabaciones de forma remota a través de teléfonos inteligentes, para construir un corpus grande y en constante actualización de acentos ingleses modernos. Ese corpus es la fuente del hallazgo sobre la vocal en quid en inglés del norte, por ejemplo. La acumulación de información de este y muchos otros proyectos nos permite rastrear la variación con una mayor cobertura, y construir modelos cada vez más precisos que predigan la realización de sonidos individuales.

    ¿Puede esta comprensión lingüística recientemente perfeccionada mejorar también la tecnología de reconocimiento de voz? Quizás, pero para mejorar, la tecnología necesita saber mucho más sobre ti.

    Este artículo se ha vuelto a publicar de The Conversation con una licencia de Creative Commons. Lea el artículo original.




    © Ciencia https://es.scienceaq.com