硅基流動 SiliconCloud 平臺即日起正式推出 DeepSeek-R1& V3API 的批量推理(Batch Inference)功能。用戶現在可以通過批量 API 向 SiliconCloud 發送請求,擺脫實時推理速率的限制,並在預期24小時內完成大規模數據處理任務。
此次更新的一大亮點是價格的大幅下調。DeepSeek-V3批量推理的價格相較實時推理直降50%。更令人驚喜的是,在3月11日至3月18日期間,DeepSeek-R1批量推理的優惠價格更是直降75%,輸入價格僅爲1元/百萬 Tokens,輸出價格爲4元/百萬 Tokens。
批量推理功能的推出,旨在幫助用戶更高效地處理生成報告、數據清洗等大批量數據處理任務,以更低的成本享受 DeepSeek-R1& V3API 服務。此功能尤其適用於無需實時響應的數據分析、模型性能評估等場景。
值得一提的是,此前 DeepSeek-R1& V3API 已相繼支持 Function Calling、JSON Mode、Prefix、FIM 等功能,並且 Pro 版 DeepSeek-R1& V3API 的 TPM(每分鐘處理的 Token)上限已從1萬提升至100萬。