TRANSLATOTRON: EL "ROBOT" DE GOOGLE QUE PUEDE TRADUCIR EN DIRECTO LA VOZ A OTRO IDIOMA, SIN USAR TEXTO

TRANSLATOTRON: EL "ROBOT" DE GOOGLE QUE PUEDE TRADUCIR EN DIRECTO LA VOZ A OTRO IDIOMA, SIN USAR TEXTO

Gracias a la Inteligencia Artificial, este sistema permite mantener la fonética y el tono de voz de las personas.

Google asegura haber creado un nuevo sistema de traducción, conocido como Translatotron, en el que a través de mecanismos de Inteligencia Artificial (IA) es capaz de traducir la voz de un idioma a otro directamente, sin necesidad de realizar ninguna conversión a texto.

La unidad especializada en Inteligencia Artificial del gigante de Mountain View, California, anunció este nuevo sistema, que propone un nuevo modelo alternativo de secuencia a secuencia con el que se elimina la necesidad de representar texto intermedio en una traducción.

El funcionamiento de Translatotron se basa en un solo proceso, en lugar de dividirlo en distintas fases como sucede en los sistemas de traducción actuales, que se apoyan en mecanismos de síntesis de voz a texto.

Con este sistema, los investigadores aseguran que pueden lograr una velocidad de traducción más rápida, en la que se evitan los errores del proceso de reconocimiento de habla y traducción, "reteniendo directamente la voz original del hablante después de la traducción".

De esta manera, según detalla Google en su blog oficial, logra también alcanzar una mejor gestión gestión de las palabras que no se traducen, como los nombres propios.

 

CÓMO FUNCIONA TRANSLATOTRON

 

El sistema de Google utiliza como fuente espectogramas con la señal de voz captada y genera otros línea de voz en el idioma elegido para la traducción. También emplea un codificador de voz neuronal que convierte el espectograma resultante en ondas de audio con referencias de tiempo.

Además, puede añadirse un mecanismo adicional que aprende las características del habla de una persona y que las codifica para lograr mantener su tono de voz, para utilizarlo posteriormente en la sintetización de la traducción de voz.

En todo el proceso, la Inteligencia Artificial de Google utiliza objetivos multitarea para predecir los movimientos de la fuente, al mismo tiempo que genera los espectogramas de la traducción.