8月23日,Meta在官網宣佈開源多語音、語言翻譯大模型SeamlessM4T。SeamlessM4T支持100種語音、語言翻譯,實現語音到文本、語音到語音、文本到語音和文本到文本的多模式翻譯。SeamlessM4T集成了Meta之前發佈的NLLB、MMS等翻譯模型,使用270,000小時對齊語音文本數據進行訓練,是目前最大、功能最全的開源翻譯模型。