メイドゥー(Meituan)のLongCat Interactionチームは、WOWServiceの大規模モデルインタラクションシステムの白書を発表し、メイドゥーのスマートカスタマーサポートで完全に導入された技術的な詳細を明らかにしました。 「データと知識の二重駆動」と四段階のトレーニングシステムにより、複雑な業務シナリオでのカスタマーサポート解決率は9%向上し、ユーザー満足度は12%向上しました。トレーニングおよびラベリング量は従来の方法の10%にとどまっています。

コアフレームワーク  

1. データと知識の二重駆動:構造化されたビジネスルールと本物の会話ログを組み合わせてトレーニングし、SKU、プロモーション、返品などに関する知識の正確性は96%です。

2. マルチエージェント協調:メインエージェントがタスクを割り当て、サブエージェントが返金、住所変更、領収証など特定のシナリオに特化しており、平均応答時間が27%減少しました。

3. 自己最適化ループ:毎日、高評価のオンライン会話を抽出し、自動ラベリングしてトレーニングに戻します。「7日間で小規模なアップデート」を実現しています。

四段階トレーニングフロー  

- 継続的プリトレーニング:500億トークンの分野別テキストを用い、ベースモデルにローカルライフ用語に精通させます。

- サービス付きファインチューニング:10%のラベル付けされたデータで、伝統的な100%ラベル付けの効果に達成でき、コストを75%削減しました。

- 直接的なパフォーマンス最適化(DPO):ポジティブおよびネガティブなサンプルペアを用いて「礼儀正しく効率的」なスタイルを調整します。

- 強化学習(RL):オンラインリアルタイム報酬は解決率とユーザー評価によって決まり、モデルがビジネス目標に自動的に一致します。

業務成果  

白書によると、WOWServiceはメイドゥーの配達、店舗訪問、ホテル、移動などの6つの主要業務ラインに導入され、大規模な販売イベントでは8,000QPS以上の負荷に対応し、全体のカスタマーサポート人力は18%節約されました。複雑なシナリオでの一度に解決される比率は84%であり、従来のベースモデルに比べて顕著に優れています。

オープンソースと今後の計画