上海 AI 實驗室於 2 月 4 日正式發佈了全球開源參數規模最大的科學多模態模型 ——“書生 Intern-S1-Pro”。這一突破性的模型基於 “通專融合” 技術架構 SAGE,所擁有的參數數量高達 1 萬億,成爲當前開源社區中的一顆耀眼明珠。

“書生 Intern-S1-Pro” 模型的核心科學能力達到了國際領先水平,特別是在高難度綜合學科評測中,顯示出超強的邏輯推理能力,甚至可以達到奧林匹克競賽金牌選手的水平。同時,該模型在處理真實科研流程中的智能體能力上,位居開源模型的第一梯隊,這無疑爲科研人員提供了更加強大的工具。

這款模型採用了混合專家架構(MoE),共配置了 512 個專家,每次調用時僅激活 8 個專家,使用 22 億個參數。這樣的設計不僅使得模型在計算效率上得到了優化,也大大降低了資源消耗。在底層架構上,“書生 Intern-S1-Pro” 實現了兩項重要突破。首先,通過引入傅里葉位置編碼和重構時序編碼器,模型獲得了從微觀生命信號到宏觀宇宙波動的 “物理直覺”,具備了更強的理解能力。其次,採用高效路由機制,解決了訓練萬億參數模型時的穩定性和算力效率瓶頸,爲超大規模模型的訓練奠定了基礎。

值得一提的是,“書生 Intern-S1-Pro” 不僅是一個學術模型,更爲未來構建開放共享的 AGI4S(人工智能爲科學)基礎設施打下了堅實的基礎。通過原創的模型架構與自主的算力技術,上海 AI 實驗室展現了中國在人工智能領域的實力與潛力。

爲了讓更多的用戶體驗這一先進模型,上海 AI 實驗室還提供了在線體驗和開源地址,方便開發者和研究者進行進一步的探索。