AgentSims 是一个开放式、自定义的沙盒评估基建设施,可以创建无限 AI 智能体,并通过任务设置来评估其能力。AgentSims 通过计划、记忆和工具使用系统实现了高度自定义的 AI 角色行为决策。与斯坦福的 AI 小镇相比,AgentSims 提供更自由的可交互界面,使研究更加方便。
相关推荐
清华团队领衔打造,首个 AI agent 系统性基准测试问世
["首个 AI agent 系统性基准测试问世,对 25 个不同语言模型的全面评估结果显示:GPT-4 独具一档。","顶级商业语言模型在复杂环境中表现出色,与开源模型存在显著优势。","研究团队建议进一步提高开源模型的学习能力。"]
2023年8月9号 14:07
137.6k
哥大开发出 AI 智能体研究员,投喂题目瞬间生成研究报告,客观真实无幻觉,已经开源人人能用
研究人员开发出的 AI 科研智能体,直接代替你写论文,人类只用负责毕业就行了。
2023年8月4号 15:12
93.6k
OpenAI 内部信炮轰 Anthropic:虚增 80 亿,营收未超我方
OpenAI内部备忘录曝光,质疑Anthropic年化收入300亿美元数据严重注水,指责其采用“总额法”夸大营收,产品力不足以支撑平台级竞争。
2026年4月14号 15:27
97.4k
“嘿,Grok!”特斯拉 2026 春季更新炸场:FSD 一键订阅,车载 AI 迎来语音时代
特斯拉2026年春季软件更新带来多项AI与自动驾驶升级。核心亮点包括:车载AI助手Grok支持“嘿,Grok”语音唤醒和“再见”关闭,新增位置感知提醒功能,提升了交互便捷性与智能化水平。
2026年4月14号 15:11
73.0k
哩布哩布AI发布致歉声明:针对生成内容规范问题已完成技术修复与风险封堵
哩布哩布AI针对AIGC安全问题发布公告,承认平台在复杂提示词组合下曾出现不合规内容,现已完成技术修复并封堵风险路径,承诺加强防范。
2026年4月14号 15:05
103.0k
