• Home
  • Química
  • Astronomía
  • Energía
  • Naturaleza
  • Biología
  • Física
  • Electrónica
  • El equipo de investigación desarrolla técnicas de localización de voz para altavoces inteligentes

    Un ejemplo de cómo Amazon Alexa podría determinar la ubicación de una persona dentro de una casa. Crédito:Romit Roy Chowdhury

    Altavoces inteligentes:piense, Amazon Alexa o Google Home:ofrecen una amplia variedad de capacidades para ayudar a liberar tanto nuestro tiempo como nuestras manos. Podemos escuchar las noticias de la mañana mientras nos cepillamos los dientes, pedir un informe meteorológico mientras elige un abrigo, y programe un temporizador para el horno mientras manipula dos cacerolas calientes a la vez. Según Voicebot.ai, Alexa admite más de 100, 000 habilidades en todo el mundo, pero una tarea que no ha dominado es determinar la ubicación del usuario en el hogar.

    Esta tarea de localización fue el foco de un artículo publicado recientemente por un equipo de investigación de la Universidad de Illinois en Urbana-Champaign, "Localización de voz mediante reflejos de pared cercanos". El trabajo fue aceptado en la 26ª Conferencia Internacional Anual sobre Computación Móvil y Redes. En el papel, el equipo, dirigido por Sheng Shen, estudiante de posgrado del Laboratorio de Ciencias Coordinado, explora el desarrollo de VoLoc, un sistema que usa la matriz de micrófonos en Alexa, así como los ecos de la voz humana en las habitaciones, para inferir la ubicación del usuario dentro de la casa.

    Conocer la ubicación de un usuario dentro de una casa podría ayudar a un dispositivo inteligente a respaldar mejor las habilidades disponibles actualmente. Por ejemplo, después de recibir comandos como "encender la luz" o "aumentar la temperatura, "Actualmente, Alexa tiene que adivinar qué luz y habitación están en el centro del comando. Usando una técnica conocida como triangulación inversa, Shen y el asesor Romit Roy Choudhury se están acercando a la localización de voz.

    "Aplicar esta técnica a altavoces inteligentes conlleva bastantes desafíos, "compartió Shen, un estudiante de ingeniería eléctrica e informática (ECE). "Primero, debemos separar la voz humana directa y cada uno de los ecos de la sala de la grabación del micrófono. Luego, debemos calcular con precisión la dirección de cada uno de estos ecos. Ambos desafíos son difíciles porque los micrófonos simplemente registran una mezcla de todos los sonidos en conjunto ".

    VoLoc aborda estos obstáculos a través de un "algoritmo de alineación y cancelación" que aísla iterativamente las direcciones de cada una de las señales de voz que llegan, y de ellos, reverse triangula la ubicación del usuario. Algunos aspectos de la geometría de la habitación se aprenden espontáneamente, que luego ayuda con la triangulación. Si bien este es un avance importante, Shen y Roy Choudhury planean expandir la investigación a más aplicaciones pronto.

    "Nuestro próximo paso inmediato es construir el marco de referencia del altavoz inteligente, "Shen explicó." Esto podría significar superponer las ubicaciones, según lo proporcionado por VoLoc, en un plano para determinar que el usuario está en el cuarto de lavado. Alternativamente, si el altavoz inteligente capta los sonidos emitidos por la lavadora y la secadora en la misma ubicación que el comando de voz, puede llegar a la misma conclusión ".

    Las posibilidades de esta función son aparentemente infinitas y podrían mejorar las capacidades actuales de Alexa.

    "Las implicaciones son importantes, "dijo Roy Choudhury, un profesor de CSL y W.J. "Jerry" Sanders III — Advanced Micro Devices, Inc. Becario en Ingeniería Eléctrica e Informática. "La ubicación puede ayudar a Alexa a mejorar el reconocimiento de voz, ya que se pueden cargar diferentes vocabularios y modelos de habla. Por ejemplo, un comando como "agregar urgente a la lista de compras" puede no tener sentido, pero si Alexa sabe que el usuario está en la lavandería, Alexa puede inferir que el usuario en realidad dijo 'agregar detergente a la lista de compras' ".

    Shen y Roy Choudhury reconocen que la tecnología podría erosionar aún más la privacidad, al permitir que empresas como Amazon y Google observen más de cerca nuestros hogares y nuestra vida cotidiana. Sin embargo, también creen que los beneficios son vitales, ya que los dispositivos inteligentes sensibles al contexto podrían convertirse en tecnologías de apoyo cruciales para la vida independiente de las personas mayores y más.

    Por ejemplo, la tecnología podría usarse para recordarle a un abuelo que vive de forma independiente que tome sus medicamentos cuando pase por el botiquín, o para recordarle a un niño que cierre el grifo cuando se quede sin baño con el agua todavía abierta.

    "Es más que interpretar comandos de voz, ", dijo Shen." También proporciona un par de ojos extra cuando se trata de cuidar a los seres queridos ".


    © Ciencia https://es.scienceaq.com