SeamlessM4T sigue un enfoque de sistema único para reducir los errores y los retrasos en los procesos de traducción, y aprovecha los avances hechos en otros modelos de la compañía, como No Language Left Behind, el traductor universal de voz y los modelos de voz multilingüe masivos.
En concreto, este modelo multimodal y multilingüe puede reconocer el discurso en cerca de cien idiomas, traducir de voz a texto en casi cien idiomas de entrada y salida, traducir de voz a voz en casi cien idiomas de entrada y 36 de salida, traducir de texto a texto en cerca de cien idiomas y traducir de texto a voz en cien idiomas de entrada y 35 de salida.
“Construir un traductor de idiomas universal, como el ficticio Pez de Babel de [la novela] Guía del autoestopista galáctico, es un desafío porque los sistemas de voz a voz y de voz a texto existentes sólo cubren una pequeña fracción de los idiomas del mundo. Pero creemos que el trabajo que anunciamos hoy es un importante paso adelante en este viaje”, asegura la compañía en su blog de IA.
Lea más: El Principito es traducido por primera vez en idioma aimara en Bolivia y llegará a Francia
Junto a este modelo, Meta también facilitado el conjunto de datos de traducción multimodal abierto SeamlessAlign, con un total de 270.000 horas de alineaciones de voz y texto.