Meta發佈了一款名爲SeamlessM4T的AI翻譯模型,它支持近100種語言的語音轉文本、文本轉文本以及文本轉語音翻譯。SeamlessM4T的語音識別能力已經達到人類水準,處理背景音和變化語音的能力也有很大提高。Meta不僅以研究許可證的形式免費開源了SeamlessM4T模型,還公開了模型的關鍵訓練數據集SeamlessAlign。這是迄今爲止用於多模式翻譯的最大的公開數據集。SeamlessM4T的發佈被認爲是向沒有語言障礙的世界邁進了一大步。雖然模型仍存在一些偏見和誤差,但Meta計劃在SeamlessM4T的基礎上進行進一步的研究和改進。
相關推薦
蘋果初代智能眼鏡細節曝光,將成 iPhone 最強 AI 配件
蘋果計劃於2026年底發佈、2027年發貨的“Apple Glasses”被CEO庫克列爲最高戰略優先級,旨在打造超越Meta的行業標杆產品。
Dec 23, 2025
149.8k
重金挖角半年即傳不和:扎克伯格與 Meta 新 AI 主管陷入關係僵局
Meta CEO扎克伯格斥巨資重塑AI部門,高薪聘請Scale AI創始人亞歷山大·王擔任負責人。然而,據《金融時報》報道,兩人關係近期趨於緊張,天價合作或已進入“蜜月期”終結階段。
Dec 23, 2025
137.6k
Meta 智能眼鏡重大更新:AI 助聽功能上線,還能根據眼前的風景點歌
Meta智能眼鏡升級,新增“對話聚焦”助聽功能,利用定向麥克風在嘈雜環境中清晰捕捉對話者聲音,並與Spotify深度集成,提升交互體驗。
Dec 22, 2025
146.0k
Meta 官宣2026上半年發佈 Mango 系列下一代模型
Meta計劃於2026年上半年發起AI全面反攻,由首席AI官Alexandr Wang領導,將推出多款下一代智能模型。核心包括統一圖像與視頻生成理解的多模態模型Mango,以及下一代大型語言模型Av。
Dec 19, 2025
111.3k
Meta發佈SAM Audio:全球首個支持“點擊分離聲音”的多模態音頻模型,一鍵提取吉他聲、人聲或狗叫
Meta發佈SAM Audio,全球首個統一多模態音頻分離模型。用戶可通過點擊視頻中物體、輸入關鍵詞或圈定時間片段,一鍵提取目標聲音或過濾噪音,實現“用眼睛聽聲音”。該技術首次模擬人類自然感知聲音的方式,支持看、說等多種交互。
Dec 18, 2025
155.4k
