近日,AIbase從網絡信息獲悉,京東正式開源了一款產品級端到端通用多智能體系統JoyAgent-JDGenie,在GAIA基準測試中以75.15%的準確率超越OWL、OpenManus等競品,位居行業前列。這款開源框架以其強大的多智能體協作能力和開箱即用的特性,爲開發者提供了快速構建AI應用的利器。
GAIA基準領跑,性能卓越
JoyAgent-JDGenie在GAIA基準測試中表現亮眼,以75.15%的總體準確率刷新了多智能體系統的性能紀錄。根據GAIA基準的評估標準,該系統在難度分級的任務中展現了優異的能力:Level1任務準確率達85%以上,Level2任務接近78%,而在最複雜的Level3任務中也取得了55%的出色成績,顯著超越其他開源框架如OWL(約65%)和OpenManus(約65%)。AIbase注意到,GAIA基準以其強調真實世界任務(如多模態處理、工具使用和複雜推理)的設計,成爲評估AI智能體能力的“金標準”,而JoyAgent-JDGenie的高分表現彰顯了其在通用場景下的強大潛力。
端到端多智能體框架,開箱即用
JoyAgent-JDGenie是一款完整的端到端多智能體系統,支持用戶通過簡單查詢或任務輸入直接獲得答案或解決方案。該框架集成了前端、後端、核心引擎以及多個子智能體模塊,包括報告生成智能體、代碼智能體、PPT智能體和文件智能體,覆蓋了從文檔處理到代碼生成、演示文稿製作等多樣化場景。AIbase瞭解到,開發者可通過掛載自定義子智能體或外部工具(如Web搜索API或Python解釋器)進一步擴展功能,滿足特定業務需求。
與傳統單一智能體系統不同,JoyAgent-JDGenie採用多層級協作設計,通過任務分解和智能體協同,高效處理複雜任務。例如,用戶輸入“生成一份關於2025年AI趨勢的PPT”,系統會自動分配任務給PPT智能體和數據分析智能體,生成包含圖表和內容的演示文稿。這種開箱即用的特性極大降低了開發門檻,適合企業快速部署AI應用。
多模態與記憶優化,智能更進一步
JoyAgent-JDGenie的多模態與記憶設計是其核心亮點。系統支持文本、圖像、代碼等多種輸入和輸出形式,能夠處理GAIA基準中的多模態任務,如解析PDF文件、分析圖像內容或處理音頻數據。此外,框架引入了跨任務級別的相似任務記憶機制,允許系統根據歷史任務記錄優化當前任務的處理效率。例如,在重複生成類似報告時,系統可調用歷史數據,減少重複計算,提升響應速度。
AIbase從社區反饋中獲悉,JoyAgent-JDGenie的多模態能力在處理複雜任務時表現出色。例如,在GAIA Level3任務中,系統能夠通過鏈式推理(Chain-of-Thought)結合外部工具,準確回答涉及多源數據整合的問題,如“根據某幅畫作和歷史記錄提取特定信息”。這種能力使其在數據分析、內容創作和自動化工作流中具有廣泛應用前景。
開源生態,助力開發者創新
JoyAgent-JDGenie的完全開源(Apache2.0許可證)爲開發者提供了極大的靈活性。AIbase瞭解到,該項目公開了前端、後端、框架、引擎以及核心子智能體的完整代碼,開發者可基於此進行二次開發或直接部署。項目還提供了詳細的文檔和快速入門指南,支持在Windows、Linux等多個平臺上運行,兼容主流硬件環境。
社區反饋顯示,JoyAgent-JDGenie的模塊化設計便於擴展。例如,開發者可通過添加新的子智能體(如專用於金融分析或醫療數據處理的智能體)快速定製系統。此外,京東團隊表示將持續優化框架,計劃引入本地化LLM支持和更高效的推理加速技術,以降低對雲端API的依賴,進一步提升性能和成本效益。
多智能體系統的未來風向
JoyAgent-JDGenie的發佈標誌着多智能體系統在開源領域的重大突破。其在GAIA基準中的領先表現,不僅體現了京東在AI技術領域的深厚積累,也爲企業級AI應用的快速落地提供了範例。AIbase認爲,隨着多智能體系統在任務協作、工具整合和多模態處理能力的持續提升,類似JoyAgent-JDGenie的框架將成爲推動AI普及化的重要力量。
對於希望嘗試JoyAgent-JDGenie的開發者,只需訪問其GitHub倉庫獲取源碼,按照指引配置環境即可快速部署。無論是構建智能客服、自動化報告生成還是複雜數據分析工具,這款框架都值得一試。
項目地址:https://github.com/jd-opensource/joyagent-jdgenie