今日,科大訊飛正式發佈了其最新研發的星火同傳語音大模型,標誌着國內首個具備端到端語音同傳能力的大模型正式面世。這一創新技術相較於訊飛此前的翻譯技術,實現了全場景翻譯效果的顯著提升,並大幅縮短了端到端的響應時間。

星火同傳語音大模型的發佈,爲用戶帶來了更加流暢、精準的同傳體驗。在訊飛演示中,搭載了星火同傳語音大模型的訊飛翻譯機在英譯中語音同傳方面幾乎實現了無延遲,非常適合出國旅遊、國際展會等場景使用。這一優化不僅顯著提升了翻譯字幕的呈現速度,還保證了中英互譯的準確性。

微信截圖_20250115110120.png

據瞭解,星火同傳語音大模型支持譯文長度反向調控,語音到文本的端到端翻譯過程中,能夠流式地進行意羣切分、語境理解和信息重組。同時,流式語音合成技術還能夠支持意羣韻律銜接和自適應語速調節,進一步提升了翻譯的自然度和流暢度。

在國際交流場景中,無論是日常對話、商務交流還是行業翻譯等高難度同傳翻譯需求,星火同傳語音大模型都展現出了卓越的性能。其內容完整度、信息準確度以及語言質量均處於行業領先水平,並超越了谷歌Gemini2.0和OpenAI GPT-4o等同傳技術。最快可實現5秒以內的同傳時延,達到了人類專家譯員的水平。

科大訊飛的星火同傳語音大模型的發佈,不僅代表了國內AI翻譯技術的重大突破,也預示着未來國際交流將更加便捷和高效。