Crédito:Google
Cliente:"Hola". Barista:"Hola. ¿Qué puedo ofrecerte?" Cliente:"Me gustaría té". Para muchos, este es el mas mundano, intercambio olvidable entre dos humanos. Para aquellos que conocen las limitaciones que enfrentan las personas sordas y con problemas de audición, el intercambio es algo fuera de lo común.
El científico investigador Dimitri Kanevsky y el ingeniero Chet Gnegy han trabajado juntos para lanzar la aplicación de Android, Transcripción en vivo. Esta aplicación toma la voz y la convierte en subtítulos en tiempo real usando el micrófono del teléfono.
Puede ver que las palabras aparecen en su teléfono Android a medida que se pronuncian. Te unes a la conversación escribiendo tu respuesta en la pantalla, a través de un teclado de retroceso.
Las poblaciones oyentes y las poblaciones sordas y con problemas de audición pueden tener conversaciones fácilmente. El conducto es simplemente la aplicación en un teléfono Android.
"Ahora podemos hacer cosas que no eran ni remotamente posibles hace unos años, como lanzarse a conversaciones en la mesa de la cena o unirse casualmente cuando surja la oportunidad, "dijo Christian Vogler, Profesor e Investigador, Universidad de Gallaudet.
Los creadores de la aplicación han tenido en cuenta que la aplicación se puede disfrutar en más idiomas que solo en inglés. Los usuarios potenciales podrán elegir entre más de 70 idiomas y dialectos; pueden esperar subtítulos precisos en el idioma que se está hablando.
Cableado describió la aplicación como una habilitación de "inteligencia de voz a texto" donde las personas con problemas de audición o sordos pueden recibir "representaciones de texto de conversaciones habladas a medida que ocurren".
Se publicó un video sobre esto el lunes. "Imagínese un mundo en el que las personas sordas o con problemas de audición puedan tener conversaciones en persona todos los días, en tiempo real."
¿Qué pone este espectáculo en la carretera? Kanevesky, sordo desde la niñez, ha trabajado en tecnología de comunicaciones y reconocimiento de voz durante más de un minuto, ¿qué tal durante los últimos 30 años?
El equipo de Live Transcribe comenzó con una pregunta / desafío:¿Qué pasaría si usáramos el reconocimiento de voz automático basado en la nube para mostrar las palabras habladas en una pantalla?
Construyeron un prototipo. En un blog, Brian Kernler dijo que los empleados de Google de las oficinas desde Mountain View hasta Taipei se involucraron. También, Universidad Gallaudet, la escuela para sordos y con problemas de audición, echado en, para comprobar que Live Transcribe iba a ser de ayuda para el uso diario. La escuela ayudó con las pruebas y las mejoras. Gallaudet es alabada como una universidad para personas sordas y con problemas de audición, una opción ideal para comentarios. Los programas y servicios de la escuela están diseñados específicamente para adaptarse a los estudiantes sordos y con problemas de audición.
"En el aspecto técnico, la aplicación se basa en ASR en la nube para proporcionar una mayor precisión combinada con un detector de voz basado en una red neuronal en el dispositivo, ", dijo SiliconANGLE. El producto Google Play señala las siguientes características de la aplicación:(1) el usuario puede responder sin hablar escribiendo respuestas (2) hay retroalimentación háptica opcional que le indica cuando alguien comienza o reanuda el habla.
"Live Transcribe se implementará gradualmente en una versión beta limitada para los usuarios de todo el mundo a través de Play Store y estará preinstalada en los dispositivos Pixel 3. Regístrese aquí para recibir una notificación cuando esté más disponible". ( Cableado :Live Transcribe se instalará en los teléfonos inteligentes Pixel 3 de Google, pero, por lo demás, ahora solo está disponible a través de una versión beta).
¿Intimidad? El sitio dijo que las transcripciones de las conversaciones no se almacenan en servidores; permanecen seguros en su dispositivo.
Aatif Sumar, Policía de Android :"Para una aplicación que se supone que está en versión beta, funciona impresionantemente bien. Tuve conversaciones por teléfono y la aplicación pudo captar la mayor parte de lo que se dijo. Incluso cuando la transcripción perdió una palabra o dos, podría captar la esencia de la conversación ".
Sumar escribió sobre esa característica háptica, también. "Si la conversación se detiene por un tiempo y luego se reanuda, el teléfono puede vibrar para avisarle ".
Una observación interesante de Lauren Goode en Cableado :Live Transcribe "se trata menos de ayudar a un usuario a navegar por el teléfono y más de personas que usan teléfonos para navegar por el mundo que existe a nuestro alrededor cuando no estamos enterrados en nuestros teléfonos".
© 2019 Science X Network