“問小白”發佈第四代開源大模型 XBai o4

開源大模型領域迎來新突破。“問小白”正式發佈其第四代開源模型 XBai o4，該模型在複雜推理能力上表現卓越，其 Medium 模式已全面超越 OpenAI o3-mini，並在部分基準測試中優於 Anthropic Claude Opus。

XBai o4引入了創新的“反思型生成範式”，通過結合 Long-CoT 強化學習和過程評分學習，實現了深度推理和高效推理鏈路篩選，同時顯著降低了推理成本。

技術突破:獨創“反思型生成範式”

XBai o4的核心創新在於其獨有的“反思型生成範式”（reflective generative form）。這一範式將 Long-CoT 強化學習與過程評分學習（Process Reward Learning）相結合，使得單個模型能夠同時完成兩個關鍵任務:

深度推理: 像人類一樣進行多步驟的複雜思考。
高質量推理鏈路篩選: 能夠評估和選擇最優的推理路徑。

更值得關注的是，XBai o4通過共享過程評分模型（PRMs）和策略模型的主幹網絡，將 過程評分的推理耗時降低了99%。這一優化大幅提升了模型的運行效率，爲實際應用提供了堅實基礎。

性能卓越:多基準測試領先

XBai o4模型提供了三種模式（low、medium、high），以適應不同複雜度的任務需求。在多項關鍵基準測試中，其強大性能得到了充分驗證:

在 Medium 模式下，XBai o4全面超越了 OpenAI 的 o3-mini 模型。
在部分基準測試中，其表現甚至優於 Anthropic 的 Claude Opus。
該模型在 AIME24、AIME25、LiveCodeBench v5、C-EVAL 等多個測試中均展現出卓越的推理能力。

“問小白”已在 GitHub 上開源了相關的訓練和評估代碼，這不僅爲 AI 研究社區提供了寶貴的資源，也預示着開源大模型在複雜推理領域的競爭力正在迅速增強。

地址:https://github.com/MetaStone-AI/XBai-o4

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

MiniMax稀宇科技於2026年6月1日發佈新一代前沿大模型M3，這是國內首個集成頂尖編程、1M超長上下文及原生多模態能力的開源模型，對標海外閉源旗艦。針對複雜智能體任務的上下文擴展瓶頸，M3自主研發稀疏注意力架構（MSA），實現更精確的KV分塊與算子層優化，計算速度較同類開源方案提升4倍以上，在1M上下文下每Token計算量顯著降低。

谷歌正式發佈 Gemma4開源大模型:涵蓋四種規格，31B 版本位列全球開源榜單第三

谷歌發佈開源大模型Gemma4，通過“單位參數智能”提升，爲開源模型輔助智能體工作流設定新標準。該系列包含2.3B、4.5B高效版及26B、31B高性能版，基於Gemini3技術棧，全系支持多模態輸入，部分版本原生支持語音輸入，實現端側實時語音理解。

“問小白”發佈第四代開源大模型 XBai o4

技術突破:獨創“反思型生成範式”

性能卓越:多基準測試領先

相關推薦

報道稱DeepSeek 完成 A 輪 510 億元融資，騰訊、京東等巨頭參與

巴西AI黑馬Rio 3. 5 翻車：被指套殼縫合兩款國產大模型

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

谷歌正式發佈 Gemma4開源大模型:涵蓋四種規格，31B 版本位列全球開源榜單第三

“問小白”發佈第四代開源大模型 XBai o4

技術突破:獨創“反思型生成範式”

性能卓越:多基準測試領先

相關推薦

報道稱DeepSeek 完成 A 輪 510 億元融資，騰訊、京東等巨頭參與

​巴西AI黑馬Rio 3. 5 翻車：被指套殼縫合兩款國產大模型

谷歌發佈Gemma 4，E2B架構讓手機本地跑AI現質變

MiniMax發佈M3 大模型：首創MSA架構並支持1M上下文，全面開源對標海外旗艦

谷歌正式發佈 Gemma4開源大模型:涵蓋四種規格，31B 版本位列全球開源榜單第三

巴西AI黑馬Rio 3. 5 翻車：被指套殼縫合兩款國產大模型