La IA de Google es capaz de traducir un idioma hablado a otro sin necesidad de texto

PIXABAY
Publicado 16/05/2019 13:51:40CET

   MADRID, 16 May. (Portaltic/EP) -

Google ha desarrollado un nuevo sistema de traducción, conocido como Translatotron, en el que a través de mecanismos de Inteligencia Artificial (IA) es capaz de traducir la voz de un idioma a otro directamente, sin necesidad de realizar ninguna conversión a texto.

   La unidad especializada en Inteligencia Artificial de Google ha anunciado este nuevo sistema, que propone un nuevo modelo alternativo de secuencia a secuencia con el que se elimina la necesidad de representar texto intermedio en una traducción.

   El funcionamiento de Translatotron, como se ha bautizado, se basa en un solo proceso, en lugar de dividirlo en distintas fases como sucede en los sistemas de traducción actuales, que se apoyan en mecanismos de síntesis de voz a texto.

   Con este sistema, los investigadores han asegurado que pueden lograr una velocidad más rápida, en la que se evitan los errores resultantes del proceso de reconocimiento de habla y traducción, "reteniendo directamente la voz original del hablante después de la traducción".

   De esta manera, según ha explicado Google, Translatotron logra también alcanzar una mejor gestión gestión de las palabras que no se traducen, como los nombres propios.

   El sistema de Google utiliza como fuente espectogramas con la señal de voz captada y genera otros línea de voz en el idioma elegido para la traducción. También emplea un codificador de voz neuronal que convierte el espectograma resultante en ondas de audio con referencias de tiempo.

   Además, puede añadirse un mecanismo adicional que aprende las características del habla de una persona y que las codifica para lograr mantener su tono de voz, para utilizarlo posteriormente en la sintetización de la traducción de voz.

   En todo el proceso, la Inteligencia Artificial de Google se utiliza objetivos multitarea para predecir los movimientos de la fuente, al mismo tiempo que genera los espectogramas de la traducción.