智譜聯合清華等提出ZCube組網架構:大模型推理吞吐提升15%，網絡成本削減三分之一

大模型推理正在重新定義AI基礎設施，網絡架構創新成爲釋放硬件潛能的關鍵路徑。2025年9月，智譜、馭馴網絡與清華大學在網絡領域頂級會議ACM SIGCOMM2025上發表了關於ZCube網絡架構的研究成果。

2026年5月21日，智譜宣佈該架構已在GLM-5.1coding生產環境中成功落地，實現了跨越式的性能調優。基準測試表明，在GPU、軟件棧及應用保持不變的前提下，ZCube架構使交換機與光模塊的資本支出減少33%，GPU平均推理吞吐提升15%，首Token時延（TTFT P99）降低40.6%，實現了兼顧高經濟性與高性能的系統級突破。

當前，隨着長上下文推理與Prefill-Decode（PD）分離部署成爲行業主流，KV Cache的跨節點傳輸呈現出高度的不對稱性。傳統基於多層交換機堆疊的ROFT(Rail-Optimized Fat-Tree)架構因靜態拓撲限制，極易引發局部熱點與PFC反壓，形成“總帶寬寬裕、局部頻繁擁塞”的結構性瓶頸。

針對這一痛點，ZCube架構打破了傳統Clos架構的層次化堆疊思路，取消了Spine層交換機，採用完全扁平化的兩組交換機進行二部圖互聯，並結合雙端口網卡的單/多軌混合接入機制。配合特有的路由策略，ZCube能確保任意GPU對之間擁有獨享的最優路徑，從結構層面完美實現流量負載均衡，可支持數萬張乃至數十萬張GPU的超大規模擴展。

在生產環境改造中，馭馴網絡團隊利用自動化控制與校驗工具，成功克服了佈線和路由策略重構的挑戰，保障了集羣的快速平穩升級。目前該千卡集羣已穩定運行兩週以上。ZCube的成功落地標誌着智算基礎設施正從通用互聯走向模型流量驅動的系統協同。未來，網絡拓撲、通信庫與調度策略的深度耦合，將成爲進一步提升Token生產效率與降低MaaS綜合成本的核心驅動力。

港股AI板塊熱度不減：智譜、MiniMax解禁日表現搶眼

港股人工智能板塊近期持續走強，7月9日，標杆企業智譜與MiniMax成爲焦點。雖面臨解禁壓力，但股價強勁上漲，彰顯資本市場對AI核心資產深度認可。其中，智譜經歷解禁擔憂後多頭全面爆發，盤中漲幅一度超20%，領漲整個板塊。

智譜GLM-5. 5 蓄勢待發：有望 8 月追趕全球頂尖大模型

智譜計劃8月發佈新一代基座大模型GLM-5.5，參數量有望破萬億，實現架構重大跨越。此舉正值美國限制Anthropic旗下Fable5與Mythos5模型訪問，這兩款模型長期盤踞全球榜首。國際大模型格局變動下，智譜藉此機遇加速突破，或填補市場空白。

智譜聯合清華等提出ZCube組網架構:大模型推理吞吐提升15%，網絡成本削減三分之一

相關推薦

港股AI板塊熱度不減：智譜、MiniMax解禁日表現搶眼

智譜完成約314億港元配售資金將用於大模型技術研發與算力建設

算力提速關鍵突破：北大與 DeepSeek 聯合開源大模型推理框架 DSpark

智譜GLM-5. 5 蓄勢待發：有望 8 月追趕全球頂尖大模型

資本市場新寵：智譜市值突破萬億，國產大模型迎來高光時刻

智譜聯合清華等提出ZCube組網架構:大模型推理吞吐提升15%，網絡成本削減三分之一

相關推薦

港股AI板塊熱度不減：智譜、MiniMax解禁日表現搶眼

智譜完成約314億港元配售 資金將用於大模型技術研發與算力建設

算力提速關鍵突破：北大與 DeepSeek 聯合開源大模型推理框架 DSpark

智譜GLM-5. 5 蓄勢待發：有望 8 月追趕全球頂尖大模型

資本市場新寵：智譜市值突破萬億，國產大模型迎來高光時刻

智譜完成約314億港元配售資金將用於大模型技術研發與算力建設