AgentSims 是一个开放式、自定义的沙盒评估基建设施,可以创建无限 AI 智能体,并通过任务设置来评估其能力。AgentSims 通过计划、记忆和工具使用系统实现了高度自定义的 AI 角色行为决策。与斯坦福的 AI 小镇相比,AgentSims 提供更自由的可交互界面,使研究更加方便。
相关推荐
清华团队领衔打造,首个 AI agent 系统性基准测试问世
["首个 AI agent 系统性基准测试问世,对 25 个不同语言模型的全面评估结果显示:GPT-4 独具一档。","顶级商业语言模型在复杂环境中表现出色,与开源模型存在显著优势。","研究团队建议进一步提高开源模型的学习能力。"]
2023年8月9号 14:07
109.5k
哥大开发出 AI 智能体研究员,投喂题目瞬间生成研究报告,客观真实无幻觉,已经开源人人能用
研究人员开发出的 AI 科研智能体,直接代替你写论文,人类只用负责毕业就行了。
2023年8月4号 15:12
81.5k
英伟达云业务战略调整:重心转向内部 AI 开发
英伟达重组云业务团队,战略重心转向内部AI开发,不再与亚马逊AWS等大型云服务商直接竞争。新任高管Alexis Black Bjorlin将推动团队整合,原数百人团队并入公司内部。
2025年12月23号 17:49
146.0k
微软纳德拉重返一线督战,Copilot付费增长为何陷入瓶颈?
微软CEO纳德拉亲自带队,深入一线“拷问”Copilot细节,打响“AI保卫战”。尽管微软凭借与OpenAI合作抢占先机,但市场反馈喜忧参半,纳德拉因此调整工作重心,从日常管理转向技术攻坚。
2025年12月23号 17:46
98.3k
上海市新增12款已完成备案的生成式人工智能服务
上海市网信办公布新增12款生成式AI服务备案,全市备案总数已达一定规模,旨在促进AI创新与规范发展,支持上海打造人工智能高地。
2025年12月23号 17:29
102.0k
