DeepSeekはV3.2(スタンダード版)とV3.2-Speciale(ディープシンキング版)をリリースしました。公式評価によると:

- V3.2は128kのコンテキスト環境においてGPT-5と互角です。

- V3.2-SpecialeはMMLU、HumanEvalなどの基準でGemini3Proと同様の性能を達成し、IMO2025の盲検テストで金メダルラインの83.3%を記録しました。

転置疎注意力(DSA)は主要なアップグレードです。「目録」風にトークンをルーティングすることで、長文の計算複雑度をO(n²)からO(n)に低下させ、VRAM使用量は40%減少し、推論速度は2.2倍向上しました。これはオープンソースモデルで初めて百万トークン単一カードでの推論を実現しました。

image.png

後処理の段階では、チームは10%以上のクラスター計算能力を強化学習に投入し、グループ対強化学習(GRPO)と多数決方式を採用し、コード、数学およびツール呼び出しのタスクで閉鎖型の競合に近づけました。V3.2-Specialeでは「思考長さペナルティ」を削除し、より長いチェーン推論を促進し、平均出力トークン数がGemini3Proよりも32%多くなりましたが、正確性は4.8ポイント上昇しました。

image.png