中国数学の金メダルが登場：DeepSeek-Math-V2 のオープンソースファイルがアップロードされ、GPT-4o と同等の性能を備える

11月27日、DeepSeekチームはHugging Faceに236Bパラメータの巨大モデル「DeepSeek-Math-V2」をリリースしました。MoEアーキテクチャを採用し、アクティブなパラメータは21Bで、コンテキスト長は一気に128Kトークンに拡張されました。公式にはApache2.0ライセンスの重みが同時に公開され、商業利用に制限はありませんでした。その日のうちにサーバーの帯域を爆発させました。

数学の実績一覧（ゼロショットCoT）:

- MATHベンチマークでは75.7%を達成し、GPT-4o（76.6%）とほぼ並ぶレベル;

- AIME2024では4/30問を正解し、Gemini1.5ProやClaude-3-Opusを上回りました;

- Math Odysseyでは53.7%を記録し、同じく第一陣にランクインしています。

モデルの核心的な秘訣は「自己検証」の二つのエンジンです：Generatorが下書きを作成し、Verifierが一行ずつチェックして誤りを指摘し、再び作成しなおす。最大16ラウンドの反復を行い、多数決とメタ検証器によって幻覚を抑圧します。トレーニングデータは1000億トークンに及んでおり、論文、競技問題、合成データを含み、GRPO強化学習を導入し、人間の好みに合わせています。

コードと数学の混合データの恩恵を受け、DeepSeek-Math-V2はプログラミング分野でも非常に強力です：HumanEval90.2%、MBPP76.2%、SWEBenchでは初めてオープンソースモデルが10%の大関門を突破し、GPT-4-TurboやClaude3Opusと直接対等になりました。

DeepSeek-Math-V2 の正式リリース：オープンソースモデルが国際数学オリンピックで金メダルを獲得

DeepSeekは世界初のオープンソース数学推論大規模モデルであるDeepSeek-Math-V2を発表しました。このモデルには6850億パラメータがあり、国際数学オリンピックの金メダルレベルに達しています。このモデルはDeepSeek-V3.2アーキテクチャに基づいており、Apache2.0ライセンスでオープンソース化されています。その核心的な突破点は、「生成-検証」の二重モデル閉ループ機構で、数学的推論能力を顕著に向上させました。

アリババ・ベイリン大モデルチームがRing-flash-linear-2.0-128Kをオープンソース化。混合アテンションとMoEアーキテクチャで長文プログラミングの効率を再構築

アリババグループがベイリン大モデルのRing-flash-linear-2.0-128Kをオープンソース化。超長文プログラミングに特化。混合線形アテンションとスパースMoEアーキテクチャを採用し、6.1Bパラメータのみを活性化することで40Bの密なモデルと同等の性能を達成。コード生成やスマートエージェント分野で最高水準の結果を実現し、長い文脈処理の問題を効率的に解決。

MiniMaxオープンソースM2モデル：高性能AIによるコード作成と代理のサポート。競合製品の価格の8%に満たない

2025年10月27日、MiniMaxが大規模言語モデル「MiniMax M2」をオープンソース化。MoEアーキテクチャ採用で、エージェントワークフローとエンドツーエンドコーディングに特化。Claude Sonnet比でコスト8%、速度約2倍の高効率・高性能を実現。....

シリコンベースのフローがアント・ペイリンチームのLing-flash-2.0でリリースされ、推論速度が新しい記録を達成

シリコンベースのプラットフォームがLing-flash-2.0をリリース。MoEアーキテクチャの100億パラメータモデルで、6.1億パラメータ使用時に40億Denseモデル並みの性能を発揮。複雑な推論やコード生成に優れ、128Kのコンテキスト長をサポート。....

中国数学の金メダルが登場：DeepSeek-Math-V2 のオープンソースファイルがアップロードされ、GPT-4o と同等の性能を備える

関連推奨

DeepSeek-Math-V2 の正式リリース：オープンソースモデルが国際数学オリンピックで金メダルを獲得

科大訊飛が新しく深層推論の大規模モデル「星火 X1.5」を発表、性能がさらに向上しました！

アリババ・ベイリン大モデルチームがRing-flash-linear-2.0-128Kをオープンソース化。混合アテンションとMoEアーキテクチャで長文プログラミングの効率を再構築

MiniMaxオープンソースM2モデル：高性能AIによるコード作成と代理のサポート。競合製品の価格の8%に満たない

シリコンベースのフローがアント・ペイリンチームのLing-flash-2.0でリリースされ、推論速度が新しい記録を達成