AgentSims 是一個開放式、自定義的沙盒評估基建設施,可以創建無限 AI 智能體,並通過任務設置來評估其能力。AgentSims 通過計劃、記憶和工具使用系統實現了高度自定義的 AI 角色行爲決策。與斯坦福的 AI 小鎮相比,AgentSims 提供更自由的可交互界面,使研究更加方便。
相關推薦
清華團隊領銜打造,首個 AI agent 系統性基準測試問世
["首個 AI agent 系統性基準測試問世,對 25 個不同語言模型的全面評估結果顯示:GPT-4 獨具一檔。","頂級商業語言模型在複雜環境中表現出色,與開源模型存在顯著優勢。","研究團隊建議進一步提高開源模型的學習能力。"]
Aug 9, 2023
112.3k
哥大開發出 AI 智能體研究員,投喂題目瞬間生成研究報告,客觀真實無幻覺,已經開源人人能用
研究人員開發出的 AI 科研智能體,直接代替你寫論文,人類只用負責畢業就行了。
Aug 4, 2023
87.1k
谷歌DeepMind推Lyria 3:AI音樂生成新標杆 非商業用途免費開放
谷歌DeepMind正式發佈了其最新一代AI音樂生成模型Lyria 3,該模型現已作爲測試版(Beta)集成至Gemini應用,並向全球年滿 18 歲的用戶免費開放。 Lyria3 最爲引人注目的特點在於其全場景創作能力。即便用戶毫無音樂基礎,也能通過三種方式輕鬆生成音樂。用戶只需輸入自然語言提示,如“一首歡快的雷鬼音樂,適合海灘派對”或“一首關於太空探索的史詩電子樂”,模型便能迅速生成一首包含人聲、歌詞和樂器伴奏的完整 30 秒歌曲,且自動匹配描述的風格、情緒和節奏。
Feb 19, 2026
135.7k
消息稱蘋果正研發三款AI可穿戴設備:包括AI智能眼鏡等
蘋果公司正全力推進三款AI可穿戴設備的研發進程,涵蓋AI智能眼鏡、AI別針/吊墜(AI pin or pendant)以及帶攝像頭的AI AirPods。這些設備均設計爲與iPhone無縫連接,並能夠與正在開發中的更智能版Siri進行深度交互。 據悉,這三款新品均將集成攝像頭功能,使AI能夠“洞察”佩戴者周圍環境,並就相關問題提供即時解答。
Feb 18, 2026
156.4k
豆包登頂蘋果App Store免費榜 此前與春晚聯動互動總數達19億
字節跳動旗下的AI助手豆包App成功反超阿里系的千問與螞蟻阿福,躍居排行榜首位。這一成績的取得,與豆包近期在央視春晚期間的高曝光度及用戶互動活動密不可分。 2月16日,豆包宣佈與央視總檯春晚展開聯動,據其披露,除夕當天豆包AI的互動總數高達19億次,展現出強大的用戶吸引力。
Feb 18, 2026
151.7k
