百度集團執行副總裁沈抖在今日舉行的2024百度雲智大會上宣佈了百度百舸計算平臺4.0的升級。這一新版本支持多芯混合訓練與多芯適配,並在萬卡集羣上實現了超過99.5%的有效訓練時長,顯著提升了算力使用效率。
在當前算力緊缺的背景下,百舸4.0的升級將幫助企業更有效地利用計算資源,降低運營成本。升級的重點在於提升“多芯混合訓練”能力,使得在萬卡規模的集羣上實現了95%的訓練效能,達到行業領先水平。

此外,百舸4.0還實現了秒級部署,將萬卡集羣的運行準備時間從數週縮短至僅1小時,極大提升了部署效率,縮短了業務上線週期。針對大模型訓練過程中頻繁出現的故障,百舸4.0升級了故障檢測手段與自動容錯機制,有效降低了故障發生頻率,減少了故障處置時間,確保了超過99.5%的有效訓練時長。
在模型推理方面,百舸4.0在速度和成本上進行了優化,尤其在長文本推理中,效率提升超過一倍,滿足了日益增長的市場需求。
