全球最大开源翻译模型!Meta 出品,支持 100 种语音、语言!

发布于AI新闻资讯
发布时间 :2023年8月24号 9:11
阅读 :1分钟
Meta 开源了全球最大的多模式翻译大模型 SeamlessM4T,支持 100 种语言,并能识别地方语言。该模型能执行语音到文本、语音到语音、文本到语音和文本到文本的多模式翻译任务。SeamlessM4T 集成了 Meta 之前发布的 NLLB、MMS 等翻译模型,并使用了大量的语音和文本对齐数据进行训练。该模型在多任务翻译中取得了先进的结果,并在鲁棒性测试中表现出色,尤其是对于背景噪声和说话人变化的识别。同时,该模型显著提高了中低资源语言的性能。