阿里巴巴在 GitHub 上發佈了其創新的自主搜索 AI 智能體 ——WebAgent。這款 AI 智能體具備端到端的信息檢索和多步推理能力,能夠像人類一樣在網絡環境中主動搜索、分析和決策。它的推出將極大提升研究人員獲取和整理信息的效率。

image.png

 WebAgent 的核心功能

WebAgent 的設計旨在幫助用戶快速獲取特定領域的最新研究成果。當用戶提出某一主題的查詢時,WebAgent 能夠主動訪問多個學術數據庫,篩選出相關文獻,並根據用戶需求進行深入分析和總結。這一過程不僅提高了信息的檢索效率,還確保了研究報告的全面性和精準性。

image.png

分工明確的兩大模塊

WebAgent 由兩個主要模塊組成:WebDancer 和 WebWalker。WebDancer 是一個智能體訓練框架,專注於提升基於網絡的信息搜索能力;而 WebWalker 則是針對 Web 遍歷的語言模型基準測試工具。

1. **WebDancer 的訓練流程 **

   WebDancer 的訓練流程分爲四個階段,從數據構建到模型優化,逐步形成一個能夠自主完成複雜信息檢索的智能體。首先,在數據構建階段,WebDancer 利用創新的方法生成高質量的訓練數據,以解決傳統數據集的侷限性。接下來是監督微調(SFT)階段,旨在通過高質量的軌跡數據對智能體進行初始化訓練,使其適應信息檢索的要求。最後,在強化學習階段,智能體通過與環境的交互學習如何在複雜任務中做出最佳決策,使用的 DAPO 算法顯著提升了數據效率和策略的魯棒性。

2. ** 多步推理能力 **

   WebAgent 的多步推理能力使其能夠整合不同文獻中的觀點,並生成一份綜合性的研究報告。這一功能對於學術研究、市場分析等領域具有重要價值。

阿里巴巴此次開源 WebAgent,不僅爲研究人員提供了強大的工具,也爲 AI 領域的研究和發展注入了新的動力。

Github:https://github.com/Alibaba-NLP/WebAgent