大規模モデル分野でまた重要なアップデートが行われました。中国のAIリーダーであるDeepSeekは、本日新たにエントリーモデルとしての< strong style="text-indent: 2em;">DeepSeek V4を正式にリリースしました。今回のリリースで最も注目すべき点は、モデルの細分化戦略です。FlashとProという2つのバージョンを通じて、高頻度で軽量なアプリケーションから複雑な推論タスクまで、さまざまなニーズを正確にカバーし、再び非常に競争力のある価格でAIビジネスの価格基準を再定義しました。

モデルマトリクス:FlashとProの差別化の位置付け

DeepSeek V4は、従来のdeepseek-chatおよびdeepseek-reasonerモデルを統合・アップグレードし、正式に2つのバージョンに分類しました:

  • DeepSeek-V4-Flash: 高コスト効果と高スループット効率を重視しており、迅速な応答が必要な汎用的な会話や基本的なテキスト処理に適しています。

  • DeepSeek-V4-Pro: 複雑な論理や深い思考のタスクおよび高性能な演算環境向けに最適化され、より強力な推論と処理能力を持っています。

両方のモデルは、特定の状況を除き、思考モード(思考モード)、Json出力、Tool Calls、および会話前缀継続(Beta)をサポートし、最大1Mのコンテキストウィンドウと最大384Kの出力長をサポートしています。これは、複雑なプロジェクトの実装において堅固な基盤を提供します。

image.png

価格体系:極めて透明で段階的な課金

今回のDeepSeekによる価格設定は明確で、キャッシュメカニズムにより企業が長期的に呼び出す際の限界コストを大幅に削減しました。以下に各モデルの具体的な課金基準を示します(単位:元/百万トークン):

モデル名入力(キャッシュヒット)入力(キャッシュミス)出力
DeepSeek-V4-Flash0.2元1元2元
DeepSeek-V4-Pro1元12元24元

注:課金はまず無料枠を使用し、その後支払い枠から控除されます。

業界分析:なぜこの価格は画期的なのか?

価格設定のロジックを見ると、DeepSeekは「キャッシュヒット」と「キャッシュミス」の顕著な価格差を通じて、開発者がキャッシュ最適化によって計算リソースの損失を抑えることを促進しており、これにより業務コストの細かい管理が可能になります。

開発者にとって、Flashバージョンの1元/百万トークン(キャッシュミス)という価格は、トップクラスのMoEモデル構造へのアクセス障壁を大幅に下げています。同時に、Proバージョンが複雑な推論タスクに対して設定した価格は、企業が知識ベースの質問応答、自動代理(Agent)などの高度なアプリケーションを構築するための性能とコストのバランスを取った国内の選択肢を提供しています。

互換性に関する重要な注意事項

公式には特別な注意喚起があります。従来のdeepseek-chatおよびdeepseek-reasonerのモデル名は後日正式に廃止される予定です。業務のスムーズな移行を確保するために、開発者は現在、deepseek-v4-flash(非思考モード対応)およびdeepseek-v4-pro(思考モード対応)を直接呼び出すことができます。

モデルの詳細なインターフェース情報および移行ガイドについては、開発者はDeepSeek API 公式ドキュメント