El reconocimiento de voz es algo fundamental en el paquete de teléfonos inteligentes últimamente, que funciona con tecnologías de compañías como Apple, Amazon o Google. El último reconocimiento de voz de Google funciona completamente offline, eliminando el retraso por completo, pero, la mutilación sigue siendo una opción.
La demora se produce porque su voz o algunos datos derivados de ella, tienen que viajar desde el dispositivo a los servidores de quien opera el servicio, donde se analiza y se envía de vuelta. Esto puede tomar desde unos pocos milisegundos hasta varios segundos completos.
Una solución bastante aceptable para todos sería hacer el reconocimiento de voz directamente en el dispositivo, pero al convertir la voz en texto en el orden de milisegundos requiere mucho poder informático. No se trata solo de escuchar un sonido y recibir una palabra, entender lo que alguien dice palabra por palabra implica mucho contexto sobre el lenguaje y la intención.
El teléfono podría hacer, pero no sería mucho más rápido que enviarlo a la nube, y además, consumiría demasiada batería. Sin embargo, el último producto de Google hace que esto sea posible con un Píxel.
El trabajo de Google se basa en los avances previos para crear un modelo suficientemente pequeño y eficiente para caber en un teléfono, pero es capaz de escuchar y transcribir el habla mientras lo hace. No es necesario esperar hasta que se termine una oración para pensar si se refiere a «ellos» o «allí», ya que se calcula al momento.
Aún así, solo funciona en Gboard, la aplicación de teclado de Google, y solo funciona en píxeles y en idioma inglés.
«Dadas las tendencias en la industria, con la convergencia de hardware especializado y mejoras algorítmicas, esperamos que las técnicas presentadas aquí se puedan adoptar pronto en más idiomas y en dominios de aplicación más grandes», dice Google.
Hacer que el reconocimiento de voz sea más receptivo y que funciona sin conexión es un buen desarrollo. Pero es algo gracioso al considerar que casi ninguno de los demás productos de Google funciona sin conexión.