AgentSims 是一個開放式、自定義的沙盒評估基建設施,可以創建無限 AI 智能體,並通過任務設置來評估其能力。AgentSims 通過計劃、記憶和工具使用系統實現了高度自定義的 AI 角色行爲決策。與斯坦福的 AI 小鎮相比,AgentSims 提供更自由的可交互界面,使研究更加方便。
相關推薦
清華團隊領銜打造,首個 AI agent 系統性基準測試問世
["首個 AI agent 系統性基準測試問世,對 25 個不同語言模型的全面評估結果顯示:GPT-4 獨具一檔。","頂級商業語言模型在複雜環境中表現出色,與開源模型存在顯著優勢。","研究團隊建議進一步提高開源模型的學習能力。"]
Aug 9, 2023
121.8k
哥大開發出 AI 智能體研究員,投喂題目瞬間生成研究報告,客觀真實無幻覺,已經開源人人能用
研究人員開發出的 AI 科研智能體,直接代替你寫論文,人類只用負責畢業就行了。
Aug 4, 2023
108.5k
騰訊發佈2025年ESG報告:加速綠電轉型,完善AI治理,推動可持續社會價值創新
騰訊2025年ESG報告顯示,公司在AI驅動下實現高質量增長,ESG評級由BBB升至A級。報告重點披露了碳中和、AI安全治理、未成年人保護等領域的實踐進展,體現了科技向善的價值觀。
Apr 9, 2026
416.9k
谷歌推出Gemini Notebooks功能:打通NotebookLM並上線個人知識庫
谷歌推出Gemini“Notebooks”功能,打造個人知識庫,幫助用戶高效處理複雜項目。該功能打通了Gemini與NotebookLM的數據壁壘,構建閉環AI工作流。用戶可在集成空間集中管理聊天記錄、文檔和PDF,導入歷史對話並通過自定義指令引導Gemini進行智能分析。
Apr 9, 2026
563.2k
阿里雲百鍊上線“記憶庫”功能:支持跨會話記憶,檢索性能提升50%
阿里雲百鍊平臺上線“記憶庫”功能,解決AI Agent在多輪對話中的遺忘問題,賦予其跨會話長期記憶能力。該功能限時免費開放,支持API調用或一鍵部署。系統內置提取、存儲、檢索、注入四大模塊,可自動提取並存儲關鍵信息,實現智能記憶調用。
Apr 9, 2026
555.7k
