北京智源人工智能研究院(BAAI)近日宣佈,已聯合生態合作伙伴構建並開源了異構統一通信庫FlagCX,旨在解決多元算力時代通信庫面臨的挑戰,填補多元算力開源軟件棧的重要空白。這一舉措響應了國家有關部門組織的“清朗·網絡平臺算法典型問題治理”專項行動,體現了算法導向正確、公平公正、公開透明等重要原則。

在多元算力時代,通信庫作爲算力大規模聚合的基礎軟件,面臨兩大挑戰:一是通信庫各異,導致通信算法的實現與優化不具備通用性和自適應性;二是無法實現跨不同芯片高效互聯。爲了應對這些挑戰,FlagCX的推出旨在實現不同芯片之間高效通信和不同場景下的大規模自適應通信優化。

微信截圖_20241230081446.png

FlagCX的架構設計遵循“零開銷”與“零成本”原則,爲上層應用提供統一的通信算子接口層,屏蔽底層不同實現細節,並基於此開發對接不同深度學習框架的插件,幫助用戶在不同框架中零成本使用FlagCX。FlagCX的設計和實現過程中,始終秉持標準化、兼容性和自適應三個基本原則。

性能測試顯示,FlagCX在跨機通信性能上實現了對廠商原生通信庫的適配基本零開銷,且跨不同芯片的異構通信性能能達到峯值帶寬的90%以上,展現了跨芯異構通信的潛力。

此外,智源研究院也在構建相關軟件生態,形成產學研協同創新的良性循環,加速異構統一通信庫技術推廣與應用落地。首批生態夥伴包括高校及研究機構、服務器廠商、芯片廠商以及雲廠商及運營商等。

FlagCX的開源地址爲:https://github.com/FlagOpen/FlagCX