Tecnología

Meta lanza el conjunto de modelos de IA Seamless para favorecer traducciones más auténticas y expresivas

Published

on

Meta ha anunciado un conjunto de modelos de inteligencia artificial (IA) que se agrupan en el modelo Seamless, que admite reconocimiento de voz automático y hacer traducciones que conserven los matices y la autenticidad de los distintos idiomas que soporta.

La compañía presentó SeamlessM4T a finales de agosto, cuando comentó que esta herramienta era capaz de realizar traducciones y transcripciones de casi cien idiomas para texto y 36 a voz como parte de sus trabajos para el desarrollo de un traductor universal.

En concreto, sigue un enfoque de sistema único para reducir los errores y los retrasos en los procesos de traducción, aprovechando avances alcanzados con otros modelos de la marca, como No Language Left Behind, el traductor universal de voz y los modelos de voz multilingüe masivos.

La compañía ha anunciado nuevas herramientas de IA, que se integran en el conjunto de modelos Seamless Comunication, compuesto por el mencionado SeamlessM4T y los modelos SealmessExpressive, SeamlessStreaming y Seamless.

Por un lado, la actualización de SeamlessM4T a una segunda versión (v2), demuestra mejoras en el rendimiento para las capacidades de reconocimiento automático de voz a voz, voz a texto y texto a voz.

Asimismo, ha dado a conocer SeamlessExpression, que “aborda ciertos aspectos poco explorados de la prosodia, como la velocidad del habla y las pausas para el ritmo, preservando la emoción y el estilo”, según ha matizado en una nota de prensa.

Por el momento, este modelo de IA generativa respeta dichos aspectos del habla en la traducción de voz a voz en distintos idiomas: inglés, español, alemán, francés, italiano y chino.

El modelo SeamlessStreaming traduce conversaciones en tiempo real, con una latencia de dos segundos, a diferencia de los sistemas convencionales, que traducen la oración una vez el usuario ha terminado de hablar.

Meta ha confirmado que SeamlessStreaming admite el reconocimiento automático de voz y la traducción de voz a texto para casi cien idiomas de entrada y salida, y la traducción de voz a voz para casi cien idiomas de entrada y 36 de salida.

Finalmente, Seamless se presenta como un modelo que funciona las capacidades de SeamlessExpressed, SeamlessStreaming y SeamlessM4T v2, según ha matizado en su página web.

You must be logged in to post a comment Login

Leave a Reply

Cancelar la respuesta

Trending

Salir de la versión móvil