Google le sigue apostando a la Inteligencia Artificial y ahora ha creado un sistema que permite leer textos con una voz sintética casi idéntica a la de los seres humanos.



Esta tecnología, denominada Tacotron 2, imita la entonación, identifica los signos de puntuación y los errores, hace pausas, pronuncia frases complejas e incluso trabalenguas.

“Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?” “Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?” El audio embebido no es soportado

El sistema se basa en dos redes neuronales: una que traduce el texto en un espectograma para representar las frecuencias de un audio y un programa creado por DeepMind (la división de innovación de inteligencia artificial de Google) que estudia el diagrama y genera los elementos de audio necesarios luego de la interpretación del texto.



El gigante tecnológico ha publicado varios audios en los que muestra los resultados de este proyecto de investigación, que por ahora está en pruebas.

Audio voz sintética Google The buses aren't the problem, they actually provide a solution El audio embebido no es soportado

The buses aren't the problem, they actually provide a solution The buses aren't the problem, they actually provide a solution El audio embebido no es soportado

Es posible escuchar tanto la voz real como el de la sintetizada, y hay que decir que cuesta identificar cuál es cuál. Se espera que en el futuro el sistema sea aplicado en el asistente de voz Google Assistant para proporcionarle mayor naturalidad.

Por ahora solo está disponible en voz femenina y en inglés.



