在國內大模型與算力底座協同發展的關鍵期,國產算力平臺與頂尖算法模型的“強強聯手”再次傳來捷報。近日,海光信息正式宣佈,旗下深算3號DCU已順利完成與騰訊混元Hy3preview大模型的深度適配工作。

這一進展標誌着國產高性能算力在支撐超大規模、複雜邏輯推理模型方面,邁出了堅實的一步。

頂級參數規模,國產算力輕鬆“駕馭”

此次參與適配的騰訊混元Hy3preview,是騰訊混元大模型家族中的最新迭代版本。作爲目前國內頂尖的開源/閉源模型代表之一,其總參數規模高達 295B(2950億)

面對如此龐大的參數體量,海光深算3號DCU展現了卓越的兼容性與計算效率。適配完成後,該組合能夠穩定承載模型的高強度運轉,確保在大規模並行計算任務中保持優異的性能表現。

突破長文本限制,賦能複雜應用場景

除了極致的計算規模,Hy3preview還具備支持 256K超長上下文的顯著優勢。這意味着模型在處理長篇文檔、超長代碼庫或複雜連續對話時,擁有更強的記憶力和邏輯關聯能力。

通過海光DCU的硬件加速,Hy3preview在以下三大核心領域實現了能力躍遷:

  • 複雜推理: 提升了邏輯鏈條的完整性,能夠應對更具挑戰性的數學或邏輯問題。

  • Agent(智能體)能力: 強化了模型作爲自主執行任務代理的響應速度與準確性。

  • 代碼生成: 優化了編程輔助體驗,能夠更精準地理解和產出高質量代碼。

算力國產化進程加速

在當前全球算力資源緊俏的背景下,海光信息與騰訊混元的此次深度適配,不僅驗證了國產DCU硬件在大型語言模型訓練與推理中的實戰價值,也爲國內企業構建自主可控的AI技術棧提供了重要參考。

隨着軟硬件生態的持續完善,這種“國產算力+本土頂尖算法”的組合,將進一步加速AI技術在千行百業的落地應用,爲數字經濟提供更穩健的底層支撐。