在2025年科大訊飛1024開發者節上,科大訊飛正式發佈AI軟硬一體解決方案,通過AI算法與硬件架構的深度融合,實現了在高噪聲、遠場等複雜環境下的精準識別與理解。這一突破被視爲語音與視覺智能融合領域的重要進展。

訊飛表示,傳統AI語音識別系統在嘈雜環境下往往存在準確率下降的問題。爲此,科大訊飛在軟硬件一體化設計上進行了系統性創新,讓AI不僅能“聽清”,還能“看懂”。

科大訊飛 (2)

基於該方案,訊飛多款AI硬件的降噪與識別性能顯著提升:

  • 訊飛智能辦公本 X5 搭載行業首創“上4下4環”八麥克風陣列,在遠場高噪音環境下的識別效果遠超 iPhone17Pro;

  • 訊飛 AI 翻譯耳機 在地鐵、展會等複雜場景中識別準確率達到 97.1%;

  • 訊飛雙屏翻譯機2.090dB 工廠轟鳴聲環境下依然實現 98.69% 的語音識別準確率。

訊飛方面稱,這些成果得益於其在語音增強、聲源定位、回聲消除和多模態感知算法上的持續積累。

在本次開發者節上,科大訊飛還發布了基於 星火語音大模型 的“百變聲音復刻”技術。用戶只需一句錄音即可高保真復刻任意音色,並可通過一條指令生成不同風格的聲音輸出。

這項技術的出現,意味着個性化語音創作進入普及階段。它可廣泛應用於數字人、有聲讀物、影視配音、內容創作等領域,讓每個人都能快速打造屬於自己的“AI聲音分身”。