爲了進一步優化平臺資源調度並確保整體服務的穩定性,阿里雲官方於 4 月 20 日發佈通知,宣佈將對大模型服務平臺“百鍊”的多模態交互開發套件實施新的限流措施。

根據公告內容,此次調整將於 2026 年 4 月 28 日正式生效。屆時,平臺針對多模態交互網關的新建連接數(即默認API調用量)將統一調整爲 10 QPS(每秒請求數)。

阿里雲方面解釋稱,調整後的額度經過科學測算,能夠支持每分鐘新建 600 通會話或每小時處理3. 6 萬通會話。這一規格足以覆蓋絕大多數開發者的日常調試需求以及常規業務場景的穩定運行。

值得注意的是,本次政策調整具有一定的針對性。對於此前已經通過官方渠道申請並完成限流額度提升的客戶,其既有權限將保持不變,不受此次默認值變更的影響。

此次動作反映出雲服務商在應對日益增長的大模型調用需求時,正通過更精細化的流量管理手段,平衡個人開發者與企業級用戶之間的資源分配。相關開發者需在 4 月 28 日前評估自身業務的調用頻次,確保平穩過渡。