プラットフォームリソースのスケジューリングをさらに最適化し、全体的なサービスの安定性を確保するため、アリババクラウドは4月20日に通知を発表し、「バイレーン」という大規模モデルプラットフォーム用のマルチモーダルインタラクション開発キットに対して新しいリミット制限措置を実施することを発表しました。

公告によると、今回の調整は2026年4月28日に正式に施行されます。その際、マルチモーダルインタラクションゲートウェイに対する新規接続数(つまりデフォルトのAPI呼び出し数)は統一して10 QPS(1秒あたりの要求数)に調整されます。

アリババクラウド側は説明し、調整後の枠は科学的に算出されており、1分間に600通話の新規作成または1時間で3万6千通話の処理をサポートできると述べています。この仕様はほとんどの開発者の日常的なデバッグ要件および通常のビジネスシナリオの安定した運用をカバーする十分なものです。

注目すべきは、今回のポリシー調整が一定の特異性を持っていることです。以前から公式経路を通じてリミット枠の向上を申請し、完了した顧客については、既存の権限が変更されず、今回のデフォルト値の変更の影響を受けません。

今回の動きは、クラウドサービスプロバイダーが増加する大規模モデルの呼び出し需要に対応する際に、個人開発者とエンタープライズユーザー間のリソース配分をバランスよく行うために、より詳細な流量管理手段を使っていることを示しています。関連する開発者は、4月28日までに自身の業務の呼び出し頻度を評価し、スムーズな移行を確保する必要があります。