5 月 6 日,人工智能領軍企業 OpenAI 聯合 AMD、博通(Broadcom)、英特爾、微軟及英偉達等多家行業巨頭,共同推出了一項名爲“多路徑可靠連接”(Multipath Reliable Connection,簡稱 MRC)的全新開放網絡協議。這一動作標誌着科技界在解決超大規模 AI 集羣效率瓶頸上邁出了關鍵一步。
該協議的核心目標在於通過技術手段優化大型 AI 訓練集羣的運行表現。在以往的模型訓練中,由於網絡連接的波動或分配不均,昂貴的 GPU 算力往往會因爲等待數據傳輸而產生閒置,造成了極大的資源浪費。MRC 協議通過提供更具可靠性的多路徑連接方案,旨在顯著提升數據傳輸的穩定性,從而大幅降低功耗並提高整體計算效率。
據瞭解,MRC 協議並非僅停留在理論階段,目前已在 OpenAI 內部得到全面應用。所有用於開發前沿模型的大型超級計算機均已部署該協議,其中涵蓋了位於美國德克薩斯州阿比林的甲骨文雲基礎設施(OCI)站點,以及微軟旗下的 Fairwater 超級計算機集羣。
隨着 AI 模型參數規模的持續攀升,底層基礎設施的效率優化已成爲各家大廠爭奪的新戰場。此次 OpenAI 選擇與多家硬件芯片廠商及雲服務商聯合發佈開放協議,不僅是爲了解決自身訓練成本問題,更展現了其試圖主導 AI 時代網絡通信標準的意圖。對於行業而言,MRC 的發佈或許將推動超大規模算力集羣進入一個更高效、更綠色的新階段。
