百度旗下的深度學習平臺飛槳近日宣佈正式發佈新一代飛槳框架3.0。此次發佈的框架3.0引入了五大核心技術創新,包括“動靜統一自動並行”等關鍵技術,旨在有效降低大模型開發和訓練成本,助力大模型時代的基礎設施建設。

作爲支撐大模型訓練和推理任務的核心基礎設施,飛槳框架3.0在性能優化方面表現出色。該框架已經支持包括文心4.5、文心X1在內的多款主流大模型,並通過優化的DeepSeek-R1滿血版單機部署,顯著提升了吞吐量,提升幅度高達一倍。

百度 (4)

在計算速度方面,飛槳框架3.0藉助其創新研製的神經網絡編譯器CINN,性能大幅提升。部分算子的執行速度提升了4倍,模型端到端的訓練速度也提升了27.4%,顯著縮短了大模型的訓練時間。

在硬件適配方面,飛槳框架3.0推出了多芯片統一適配方案,支持60餘款主流芯片,並涵蓋了訓練集羣、自動駕駛、智能終端等多種應用場景。開發者只需編寫一次代碼,即可實現跨芯片的無縫遷移,硬件適配成本大幅降低,直降80%。

飛槳3.0的發佈無疑是對深度學習框架的一次技術革新,爲大規模人工智能模型的開發和部署提供了更高效、更靈活的支持。