AI角色扮演正從簡單的“文字對話”向複雜的“沉浸式戲劇”進化。近日,浙江大學聯合騰訊優圖實驗室提出了一種名爲 AdaMARP 的自適應多智能體交互框架。該研究旨在解決當前大語言模型在角色扮演中存在的環境感缺失、敘事僵化等痛點,賦予AI如同“導演”般的場景調度與敘事能力。目前,該成果已被國際學術會議 ACL 2026 接收。

核心痛點:缺失的“環境”與“導演”

在現有的AI角色扮演中,用戶雖能與歷史或小說人物對話,但互動往往侷限於文本交互,場景和角色多爲靜態。以探案場景爲例,傳統的AI系統往往只是一個“會說話的復讀機”,無法根據環境線索(如地毯上的蠟痕)進行推理,也難以處理多角色輪替或場景切換等複雜敘事需求。這種“空對空”的模式導致用戶難以獲得真正的真實感與敘事張力。

AdaMARP框架:四通道消息與動態調度

爲了打破僵局,研究團隊設計了全新的交互邏輯。首先,AdaMARP 引入了“四通道消息格式”,將每一輪交互拆解爲“思考(Thought)—動作(Action)—環境(Environment)—言語(Speech)”。在這種模式下,AI不再只是輸出臺詞,而是能交織呈現環境的氛圍(如煤氣燈搖曳)、內心的考量以及肢體語言,形成一條完整的因果鏈。

其次,該框架引入了“場景管理器(Scene Manager)”角色,充當整個敘事的“導演”。它具備五種核心能力:初始化場景、選擇發言者、切換場景、動態引入新角色以及結束互動。這意味着AI系統可以自主決定何時從案發現場轉移到證人家中,或者何時讓一名新的嫌疑人“推門而入”。

訓練與評測:從文學提取到仿真模擬

爲了讓AI真正掌握“演技”與“導戲”能力,研究團隊構建了高質量的數據集 AdaRPSet 和 AdaSMSet。這些數據不僅包含從 81 本經典文學作品中提取的深度人設與互動軌跡,還涵蓋了 20 類不同主題的合成情節,確保模型在學習文學質感的同時,也能掌握動態調度的邏輯。

此外,團隊還推出了配套的評測框架 AdaptiveBench。與傳統的單輪對話評估不同,該框架從軌跡級別對模型進行打分,重點考察角色一致性、環境感知力以及敘事推進的自然度,從而全方位衡量AI在複雜長文本互動中的表現。

這一框架的提出,爲探案推理、冒險敘事等深度沉浸式交互場景提供了新的技術路徑。通過環境與敘事邏輯的深度耦合,AI正從一個單純的聊天助手,向具備高階創作意識的數字化演繹者演進。