硅基流動官微宣佈,即刻起,硅基流動SiliconCloud平臺的DeepSeek-R1&V3API支持批量推理(BatchInference)。
用戶通過批量 API 發送請求到 SiliconCloud,不受實時推理速率限制的影響,預期可在24小時內完成任務。相比實時推理,DeepSeek-V3 批量推理價格直降50%,其中,3月11日至3月18日,DeepSeek-R1批量推理優惠價格直降75%,輸入價格爲 1元 / 百萬 Tokens、輸出價格爲4元 / 百萬 Tokens。
批量推理可幫助用戶更高效處理生成報告、數據清洗等大批量數據處理任務,享受更低成本的 DeepSeek-R1& V3API 服務,適用於無需實時響應的數據分析、模型性能評估等場景。