腾讯的研究者们发现,大语言模型的性能会随着实例化agent数量的增加而增强,无需复杂的多LLM agents协作框架。实验结果显示多个小LM集成可以超越较大LM的性能。论文探讨了性能提升与问题难度之间的关系,并提出了逐步采样和投票、分层采样和投票两种优化策略。
相关推荐
Firefox 新版本被指AI 功能默认开启,隐私与性能争议不断
Firefox新版默认开启AI功能引发争议,用户担忧隐私与性能问题。测试显示启用后CPU和内存占用显著增加,影响浏览体验,且多数用户不知情。
2025年11月11号 16:34
116.1k
研究揭示 AI 生成社交媒体内容易被识别,情感表达仍待提升
研究发现,AI生成的社交媒体帖子容易被人类识别,准确率达70%-80%,远超随机水平。研究团队测试了多个大语言模型,揭示其在内容识别方面的不足。
2025年11月10号 17:00
116.1k
全球首个具身智能开放平台上线!3D数字人第一次“开箱即用”:魔珐星云把大模型塞进百元芯片
魔珐科技发布全球首个3D数字人开放平台“魔珐星云”,让AI从文字对话升级为实时生成带表情、手势和身体动作的3D数字人。其核心3D多模态引擎可输入文本后毫秒级输出同步语音与动作,并适配手机、车载等多种终端,实现AI从“说话”到“表演”的进化。
2025年10月31号 10:21
139.6k
OpenAI 推出 Aardvark:智能安全研究助手助力软件防护
OpenAI推出基于GPT-5的智能安全助手Aardvark,帮助开发者和安全团队高效应对每年数万新漏洞的挑战。该工具通过持续分析源代码,自动识别漏洞、评估风险、优先排序并提供修复方案,显著提升软件安全防护效率。
2025年10月31号 9:48
131.1k
MiniMax开源M2模型:高性能AI赋能编码与代理 成本仅为竞品8%
2025年10月27日,MiniMax开源大语言模型MiniMax M2。该模型专为代理工作流和端到端编码设计,采用MoE架构,效率与性能突出:成本仅为Claude Sonnet的8%,速度提升约两倍,为开发者与企业提供高性价比AI解决方案。
2025年10月27号 14:51
230.4k
