正文

首尔国立大学研究人员引入强化学习革新数字艺术拼贴

发布于AI新闻资讯

发布时间 :2023年11月29号 16:28

阅读 :1分钟

首尔国立大学的研究人员利用强化学习训练了能够自主创作真正拼贴艺术品的 AI 代理人。他们通过与画布互动的方式让强化学习模型学习拼贴艺术品的创作过程。通过用户研究和基于 CLIP 的评估，证明了该方法在 AI 生成的艺术方面的出色性能。

腾讯发布OpenSearch-VL：开源多模态深度搜索 agent 的“全家桶”方案

腾讯混元联合UCLA、港中文等机构，针对多模态大语言模型（MLLMs）从“被动理解”向“主动推理”进化的需求，开源了多模态搜索智能体。此前，高质量数据、自动化轨迹合成路径及训练配方的缺失，导致顶尖智能体难以复现。此次开源旨在打破僵局，推动社区发展。

阿里通义实验室推出FIPO算法，突破传统强化学习在复杂逻辑推理中的瓶颈。该算法通过Future-KL机制，精准识别关键推理步骤，有效解决模型在数学等复杂问题中推理长度停滞的问题，显著提升推理准确率和效率。

阿里通义实验室发布新型算法FIPO，通过引入“Future-KL”机制，有效解决纯强化学习在长文本推理中的“推理长度停滞”问题，提升复杂逻辑对齐训练效果。

MiniMax与腾讯云合作，成功部署了具备百万级吞吐、十万级并发能力的Agent强化学习沙箱，并在测试环境中实现全量平稳运行。这标志着AI智能体底层基建能力取得重要突破，为其大规模应用提供了关键支撑。

腾讯混元3D团队开源了强化学习后训练框架WorldCompass，旨在提升世界模型在交互中的准确性和用户体验。该框架针对当前世界模型在处理复杂指令时易出现偏差的问题，通过强化学习优化模型表现。

智启未来，您的人工智能解决方案智库