阿里雲通義實驗室今日宣佈,已將通義DeepResearch完全開源。這款開創性的Web代理工具,以僅300億參數(實際激活30億)的輕量級規模,在性能上實現了對標OpenAI深度研究工具的突破。

通義DeepResearch在多項權威基準測試中表現卓越,包括在Humanity's Last Exam中獲得32.9分,在BrowseComp上取得45.3分,並在xbench-DeepSearch中斬獲75.0的高分,這標誌着開源AI智能體在複雜信息檢索和推理領域取得了重大進展。

QQ20250917-085040.png

該代理專爲處理多步、長週期的深度信息蒐集任務而設計,支持128K的超長上下文。它能夠將複雜問題高效分解,進行多步推理,並整合海量數據。其背後的技術創新包括智能體數據持續預訓練和on-policy強化學習,這使得它在處理多輪交互和實時數據處理的場景中,如多日行程規劃和法律文檔分析,表現出強大的穩定性和可靠性。

通義DeepResearch提供兩種推理模式:適用於輕量級任務的單模型ReAct模式,以及通過多Agent並行協作、支持算力擴展的Heavy模式。目前,該技術已在實際應用中落地,例如集成到高德地圖,幫助用戶規劃個性化多日行程;同時,它也賦能法律助手“通義法睿”,顯著提升了合同風險評估和案件分析的效率。

作爲阿里雲通義系列大模型生態的重要一環,通義DeepResearch的開源將極大地降低AI代理的開發門檻。該系列此前已開源超過200款不同參數規模的模型,並催生了Hugging Face平臺上超過10萬個二次開發模型。專家認爲,此次開源將爲開發者和小型團隊提供強大的基礎,幫助他們快速構建出特定領域的AI智能體。