AgentSims 是一个开放式、自定义的沙盒评估基建设施,可以创建无限 AI 智能体,并通过任务设置来评估其能力。AgentSims 通过计划、记忆和工具使用系统实现了高度自定义的 AI 角色行为决策。与斯坦福的 AI 小镇相比,AgentSims 提供更自由的可交互界面,使研究更加方便。
相关推荐
清华团队领衔打造,首个 AI agent 系统性基准测试问世
["首个 AI agent 系统性基准测试问世,对 25 个不同语言模型的全面评估结果显示:GPT-4 独具一档。","顶级商业语言模型在复杂环境中表现出色,与开源模型存在显著优势。","研究团队建议进一步提高开源模型的学习能力。"]
2023年8月9号 14:07
135.8k
哥大开发出 AI 智能体研究员,投喂题目瞬间生成研究报告,客观真实无幻觉,已经开源人人能用
研究人员开发出的 AI 科研智能体,直接代替你写论文,人类只用负责毕业就行了。
2023年8月4号 15:12
143.3k
Anthropic 发布 Claude 安全隔离架构:三款产品展现多层防护策略
Anthropic工程团队分享了开发三款AI产品(claude.ai、Claude Code和Claude Cowork)的安全隔离系统经验。三款产品分别面向普通用户、开发者和企业用户,遵循“环境层隔离优先”原则。其中claude.ai采用基于gVisor的临时容器方案,每次用户会话都会生成临时容器。
2026年6月4号 17:29
783.3k
进军全能工作流!Meta 智能体全球上线,WhatsApp 变身中小企业 AI 助手
Meta宣布将旗下客户支持AI机器人更名为“Meta商务智能体”,并在全球WhatsApp Business平台全面上线。此举标志着WhatsApp从小商户沟通工具升级为具备工作流处理能力的生产力软件,加速了AI在通信生态中的渗透。
2026年6月4号 17:14
180.7k
谷歌云AI生态再迎超级大客户!瑞典独角兽 Lovable 签约扩容 5 倍算力
瑞典初创公司Lovable与谷歌云达成长期深度合作,虽未公开金额,但知情人士称其云资源和AI使用量将增至5倍。作为欧洲增长最快的初创公司之一,Lovable在“全自动AI编码”赛道表现抢眼,此次合作标志着全球云算力与AI生态的强强联合。
2026年6月4号 17:12
142.3k
