シリコンベースの流動プラットフォームSiliconCloudは、本日よりDeepSeek-R1&V3APIのバッチ推論機能を正式にリリースしました。ユーザーは、バッチAPIを通じてSiliconCloudにリクエストを送信することで、リアルタイム推論速度の制限から解放され、最大24時間以内に大規模データ処理タスクを完了できます。
今回のアップデートの大きな特徴は、価格の大幅な値下げです。DeepSeek-V3のバッチ推論価格は、リアルタイム推論と比較して50%削減されました。さらに嬉しいことに、3月11日から3月18日までの期間、DeepSeek-R1のバッチ推論は75%割引され、入力価格は1元/百万トークン、出力価格は4元/百万トークンとなります。
バッチ推論機能の導入は、レポート作成、データクレンジングなど、大量のデータ処理タスクをより効率的に、より低コストでDeepSeek-R1&V3APIサービスを利用できるようにすることを目的としています。この機能は、リアルタイムレスポンスが不要なデータ分析、モデル性能評価などのシナリオに特に適しています。
なお、DeepSeek-R1&V3APIは、これまでにFunction Calling、JSONモード、Prefix、FIMなどの機能をサポートしており、Pro版DeepSeek-R1&V3APIのTPM(毎分処理トークン数)の上限は1万から100万に引き上げられました。