La Inteligencia Artificial de Google se ha distinguido últimamente por su alto grado de fiabilidad, tanto que ya no requiere la intervención de humanos para el proceso de aprendizaje. La compañía busca expandir más su trabajo y está desarrollando Tacotron 2.
Este proyecto se presentó por medio de arXiv.org, y muestra los detalles de un sistema de lectura de texto a voz, que por medio de una red neuronal impulsada por inteligencia artificial, puede emular la voz de los humanos a la perfección.
Tacotron 2 crea un espectrograma del texto leído, que es una representación visual de cómo suena el discurso. La imagen se coloca por medio del algoritmo WaveNet de Google, para que la inteligencia artificial imite de forma precisa el habla humana.
El algoritmo de WaveNet puede aprender distintas voces y generar respiraciones artificiales con facilidad, por lo que Tacotron 2 puede detectar la diferencia entre sustantivos y verbos en función del contexto, modificando así su pronunciación.
Según el estudio, la plataforma puede cambiar la intención de tono para la elaboración de enunciaciones en sentido interrogativo.
Tacotron 2 está en fase preliminar de desarrollo, por lo que se requiere un poco más de tiempo para verlo funcionar al 100 por ciento.