美團LongCat Interaction團隊發佈WOWService大模型交互系統白皮書,披露已在美團智能客服全量上線的技術細節:通過“數據+知識雙驅動”與四階段訓練體系,複雜業務場景下客服解決率提升9%,用戶滿意度提升12%,訓練標註量僅爲傳統方案的10%。
核心框架
1. 數據知識雙驅動:結構化業務規則+真實對話日誌聯合訓練,模型在SKU、促銷、售後等知識點準確率96%
2. 多智能體協同:主Agent負責任務分發,子Agent專精退款、改地址、發票等場景,平均響應時長下降27%
3. 自我優化閉環:每日抽取線上高評分對話,自動標註後迴流訓練,實現“7天一小迭代”
四階段訓練流程
- 持續預訓練:500億token領域語料,讓基座模型熟悉本地生活術語
- 有監督微調:10%標註數據→達到傳統100%標註效果,成本節省75%
- 直接偏好優化(DPO):用正負樣本對校準“禮貌+高效”風格
- 強化學習(RL):線上實時獎勵=解決率+用戶評分,模型自動對齊商業目標
業務成效
白皮書顯示,WOWService已在美團外賣、到店、酒店、出行等六大業務線落地,大促高峯承壓>8,000QPS,整體客服人力節省18%,複雜場景一次性解決率達84%,顯著優於原有基座模型。
開源與後續
團隊計劃2026Q1開源輕量版本WOWService-Lite(<7B參數)與多智能體框架,供社區二次開發;同時聯合中國計算機學會發布“本地生活大模型Benchmark”,推動行業標準化。
