近年來,以ChatGPT爲代表的大語言模型掀起了 AI 領域的新浪潮。這些強大的語言模型不僅能理解人類指令,還能制定計劃、探索環境並利用工具解決複雜任務,展現出在機器人、個人助理和流程自動化等領域的巨大潛力。

然而,現有的 AI 智能體系統大多是被動的,需要明確的人類指令才能執行任務,想要安排個會議,還得手動輸入時間、地點,甚至連參會人員都得一一列出來,簡直比自己動手還麻煩!
試想一下,當你收到一封來自同事的電子郵件,建議召開一次會議,一個被動的 AI 智能體會等待你明確指示它安排會議。而一個主動的 AI 智能體則會注意到這封郵件,並主動提出安排會議的請求。這種主動性不僅大大減輕了用戶的認知負擔,還能識別出人類未明確表達的潛在需求。

爲了解決AI助手太被動的問題,清華大學和麪壁智能強強聯手,提出了一種全新的AI智能體,它不再是“言聽計從”的機器,而是能“未卜先知”,在你還沒開口之前,就主動幫你把事情安排得明明白白!
這個“神奇”的AI智能體是如何做到的呢?祕密武器就是 ProactiveBench 數據集!這個數據集就像一本記錄了人類各種活動的“百科全書”,裏面包含了你在電腦前敲下的每一個字母、點擊的每一個鏈接,甚至連你複製粘貼的內容都記錄得清清楚楚!

利用這個數據集,研究人員訓練了一個 獎勵模型,它就像一個“模擬人類大腦”的超級計算機,能夠判斷AI智能體的行爲是否符合人類的預期。如果AI智能體表現出色,就會獲得獎勵,反之則會被扣分。經過反覆訓練,AI智能體就能像人類一樣,根據你的行爲預測你的需求,並在你需要的時候主動提供幫助。
舉個例子,當你收到一封來自同事的郵件,建議召開一次會議,這個“未卜先知”的AI智能體就會自動識別郵件內容,並主動詢問你是否需要安排會議。如果你同意,它就會自動幫你安排時間、地點,甚至還會幫你發送會議邀請!是不是比現在的AI助手“聰明”多了?
實驗結果表明,使用 ProactiveBench 數據集 訓練的AI智能體表現非常出色,例如,Qwen2-7B-Instruct 模型 在主動提供幫助方面的 F1得分 高達66.47%,超過了所有開源和閉源模型!
雖然這個“未卜先知”的AI智能體還處於研究階段,但它爲未來人機協作的進步帶來了新的希望。相信在不久的將來,我們就能擁有一個真正“懂你”的AI助手,它不僅能“言聽計從”,還能主動幫你解決各種問題,讓你的生活更加輕鬆便捷!
論文地址:https://arxiv.org/pdf/2410.12361
