在近日的互動平臺上,科大訊飛宣佈了一個振奮人心的消息:經過幾年的努力和投資,他們在星火大模型的訓練和推理效率上取得了顯著進展。與直接依賴英偉達顯卡的傳統方法不同,科大訊飛選擇了更具挑戰性的全國產算力方案。在資源有限的條件下,他們的團隊與華爲合作,成功克服了多個技術難關。
從 2023 年 5 月開始,科大訊飛與華爲的合作使得多個技術瓶頸得以打破,包括萬卡高速互聯組網、計算通信的優化,以及高吞吐量推理的實現。這些努力的結果是,科大訊飛的通用大模型和深度推理模型的訓練效率已從最初的 30%-50% 提升至 85%-95% 之間,表現出色,幾乎可以與英偉達的 A100 顯卡相媲美。
而在 2025 年,科大訊飛進一步迎接挑戰,成功解決了國產算力訓練中的兩大難題。一方面,他們提升了長思維鏈強化學習的訓練效率,將其從對標 A800 的 30% 提升至 84% 以上;另一方面,他們還在 MoE 模型的全鏈路訓練效率上取得突破,訓練效率從今年 3 月的 30% 飆升至 93%。這些成果不僅標誌着國產算力技術的重大進步,還爲科大訊飛在這一領域打下了堅實的基礎。
隨着國產算力技術的不斷提升,科大訊飛的訓練成本預計將會大幅下降。這將爲公司未來的發展帶來更多的可能性,也爲中國科技產業的自主創新樹立了榜樣。
總之,科大訊飛的這些成就不僅展示了他們在大模型訓練領域的技術實力,也爲國產算力的未來發展提供了強有力的信心支持。
