近日,百度正式宣佈開源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活參數的混合專家(MoE)模型,以及0.3B 參數的稠密型模型。此次開源不僅實現了預訓練權重的完整公開,還提供了推理代碼,標誌着百度在大模型領域的重大進展。

這些新發布的模型可以在飛槳星河社區、Hugging Face 等平臺上下載和部署,同時,百度智能雲千帆大模型平臺也提供了相應的 API 服務。這一舉措使百度成爲國內繼騰訊、阿里、字節跳動之後,又一家積極參與開源的科技巨頭,表明其在大模型應用時代的決心。

元宇宙 科幻 賽博朋克 繪畫 (5)大模型

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

早在今年2月,百度就已透露文心大模型4.5系列的推出計劃,並預告於6月30日開源。儘管此次開源列表中未包含其升級版文心大模型4.5Turbo,但仍引發了開發者的熱議。許多開發者認爲,小參數版本模型非常適合內存受限的配置,且在性能上也表現不俗,有望與其他大型模型如 DeepSeek V3和阿里 Qwen 進行競爭。

文心大模型4.5系列是一款原生多模態基礎大模型,百度在多個測試中顯示其表現超越了競爭對手 GPT-4o。該模型不僅能理解文本,還能處理照片、視頻等多種視覺信息,展示了其在多模態理解與生成方面的強大能力。

百度在開源文心大模型4.5系列的背後,主要依靠三大技術創新:首先是多模態異構 MoE 預訓練,使模型能夠有效捕捉文本和視覺模態的信息;其次是高效的基礎設施,以實現快速訓練和推理;最後是針對特定模態的後訓練,使得模型在多樣化的實際應用中表現更佳。

隨着全球大模型市場競爭的加劇,百度的開源舉措無疑對其他閉源模型供應商形成了壓力,提升了整個行業的技術標準。這一行動也爲廣大開發者和研究人員提供了更多自由度,有助於他們更快速地進行模型迭代與應用,推動人工智能的進步。