國產“數學金牌”橫空出世：DeepSeek-Math-V2 開源文件已上傳，性能對標 GPT-4o

11月27日，DeepSeek 團隊在 Hugging Face 扔出236B 參數巨獸——DeepSeek-Math-V2，採用 MoE 架構，活躍參數僅21B，上下文一口氣拉到128K token。官方同步放出 Apache2.0權重，商業限制爲零，當天就衝爆服務器帶寬。

數學戰績一覽（零樣本 CoT）:

- MATH 基準75.7%，與 GPT-4o（76.6%）幾乎肩並肩;

- AIME20244/30題，多於 Gemini1.5Pro、Claude-3-Opus;

- Math Odyssey53.7%，同樣躋身第一梯隊。

模型核心祕籍是“自驗證”雙引擎:Generator 先出草稿，Verifier 逐行檢查，把錯誤打回重寫，最多16輪迭代，用多數投票+元驗證器壓制幻覺。訓練語料達 1000億 token，囊括論文、競賽題與合成數據，並引入 GRPO 強化學習對齊人類偏好。

得益於代碼-數學混合語料，DeepSeek-Math-V2在編程端同樣兇狠:HumanEval90.2%、MBPP76.2%、SWEBench 首次讓開源模型破10% 大關，直接對標 GPT-4-Turbo、Claude3Opus 。

目前模型已上線 Hugging Face，80GB 顯存即可多卡推理;社區復現正火速進行。想給 AI 裝一顆“數學金牌”大腦，現在只需一行 `transformers` 加載——國產開源，再次把閉源巨頭的護城河切成顯微鏡下的裂縫。

DeepSeek-Math-V2 正式發佈：開源模型首次以金牌成績征服國際數學奧林匹克

DeepSeek發佈全球首個開源數學推理大模型DeepSeek-Math-V2，擁有6850億參數，達到國際數學奧賽金牌水平。該模型基於DeepSeek-V3.2架構，採用Apache2.0協議開源，其核心突破是創新的“生成-驗證”雙模型閉環機制，顯著提升了數學推理能力。

硅基流動上線螞蟻百靈團隊 Ling-flash-2.0，推理速度再創新高

近日，硅基流動大模型服務平臺正式上線了螞蟻集團百靈團隊最新開源的 Ling-flash-2.0，這是該平臺上線的第130個模型。Ling-flash-2.0是一款基於 MoE 架構的大型語言模型，擁有100億參數，並且在激活時僅使用6.1億參數（非嵌入激活4.8億）。經過20TB 以上高質量語料的預訓練、監督微調和多階段強化學習，該模型在激活6億以上參數的情況下，展現出了媲美40億參數 Dense 模型的卓越性能。Ling-flash-2.0在複雜推理、代碼生成和前端研發等領域表現出色，能夠支持最大128K 的上下文長度，給用戶提供更

國產“數學金牌”橫空出世：DeepSeek-Math-V2 開源文件已上傳，性能對標 GPT-4o

相關推薦

DeepSeek-Math-V2 正式發佈：開源模型首次以金牌成績征服國際數學奧林匹克

科大訊飛推出全新深度推理大模型：星火 X1.5，性能再創新高！

螞蟻百靈大模型團隊開源Ring-flash-linear-2.0-128K，混合注意力+MoE架構重塑長文本編程效率

MiniMax開源M2模型:高性能AI賦能編碼與代理成本僅爲競品8%

硅基流動上線螞蟻百靈團隊 Ling-flash-2.0，推理速度再創新高

國產“數學金牌”橫空出世：DeepSeek-Math-V2 開源文件已上傳，性能對標 GPT-4o

相關推薦

DeepSeek-Math-V2 正式發佈：開源模型首次以金牌成績征服國際數學奧林匹克

科大訊飛推出全新深度推理大模型：星火 X1.5，性能再創新高！

螞蟻百靈大模型團隊開源Ring-flash-linear-2.0-128K，混合注意力+MoE架構重塑長文本編程效率

MiniMax開源M2模型:高性能AI賦能編碼與代理 成本僅爲競品8%

​硅基流動上線螞蟻百靈團隊 Ling-flash-2.0，推理速度再創新高

MiniMax開源M2模型:高性能AI賦能編碼與代理成本僅爲競品8%

硅基流動上線螞蟻百靈團隊 Ling-flash-2.0，推理速度再創新高