Deepmind, la inteligencia artificial de Google, aprende a hablar como un humano

Robot de Pixar con teclado Wall-E
PHOTOGRAPHER: ARTHUR CARANTA/FLICKR/CC
Publicado 09/09/2016 17:25:06CET

   MADRID, 9 Sep. (EDIZIONES/Poraltic) -

Deepmind, la inteligencia artificial de Google, es capaz de jugar al Go y a videojuegos, de escribir poesía, de ayudar en la predicción de enfermedades y ahora también de hablar como cualquier ser humanos gracias a WaveNet.

   WaveNet es un modelo de generación de ondas de audio sin procesar, capaz de generar un discurso que simula la voz del ser humano. Para ello, la red neuronal ha sido entrenada con grabaciones reales procedentes de hablantes humanos.

   La generación del discurso en WaveNet empezaba con la transformación de un texto en información sobre sus fonemas, sílabas y palabras, que se unían a los ejemplos de audio reales con el fin de avanzar en la predicción. El texto permite que el discurso sea más preciso.

   Deepmind también ha sido entrenado para distinguir si el hablante es hombre o mujer y, en consecuencia, ser capaz de cambiar de identidad, o para expresar distintas emociones, con el objetivo de que el discurso sea más diverso.

   Es programa va un paso más allá respecto a otros sistemas, como los de reconocimiento de voz o los que convierten un texto en audio. WaveNet genera un sonido más similar al del ser humano, hasta el punto de reducir la brecha con el desempeño humano en un 50%, según han explicado en la web del proyecto de Deepmind.

Esta web utiliza cookies propias y de terceros para analizar su navegación y ofrecerle un servicio más personalizado y publicidad acorde a sus intereses. Continuar navegando implica la aceptación de nuestra política de cookies -
Uso de cookies