最近,科学家们发现一个“逆转诅咒”的现象——大模型无法进行逆向推理。论文通过虚拟和真实场景实验表明,不管体量大小,顶流大模型都存在这个bug。这暴露了大模型逻辑推理能力的局限,可能影响重要应用领域,存疑其可靠性。基于大模型的AI应用日益广泛,逆转诅咒警示人们不要对其可靠性过于乐观。
相关推荐
加速端侧大模型进化:面壁智能获数亿元新融资,深度布局智能座舱与终端生态
面壁智能完成数亿元融资,投资方包括京国瑞、国科投资等。资金将重点投入端侧高效大模型的研发,以巩固其在终端智能市场的技术优势。作为国内端侧AI领域的先行者,公司已构建从理论到全场景产品的完整体系。
2025年12月23号 14:48
148.8k
国产大模型首登顶!文心5.0 Preview在LMArena全球竞技场拿下中国最高分
百度文心5.0Preview在LMArena最新排名中以1451分登顶国内大模型榜首,展现其在创意写作和高难度任务上的强劲实力,标志着国产大模型取得重要突破。
2025年12月23号 14:00
159.2k
优必选子公司优奇联手火山引擎,豆包大模型赋能具身智能新赛道
优必选旗下优奇与火山引擎合作,整合机器人本体与云端AI技术,加速大模型在工业物流领域的应用。双方将围绕多模态大模型、VLA模型、世界模型及豆包生态展开合作,推动技术规模化落地。
2025年12月23号 9:41
130.2k
国家知识产权局推出 18 项“人工智能+”场景
国家知识产权局发布首批18项“人工智能+”知识产权公共服务应用场景,覆盖12个省份,标志着我国知识产权服务智能化转型迈出实质性步伐。各地创新实践各具特色,如北京聚焦海外维权与未来产业创新,上海探索基于大模型的专利动态分析。
2025年12月23号 9:27
143.4k
耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录
AI持续执行能力成新焦点,Claude Opus4.5在超长任务处理上创纪录,成功率50%下可持续工作近5小时,刷新行业标准。
2025年12月22号 11:06
140.6k
