最近,科学家们发现一个“逆转诅咒”的现象——大模型无法进行逆向推理。论文通过虚拟和真实场景实验表明,不管体量大小,顶流大模型都存在这个bug。这暴露了大模型逻辑推理能力的局限,可能影响重要应用领域,存疑其可靠性。基于大模型的AI应用日益广泛,逆转诅咒警示人们不要对其可靠性过于乐观。
相关推荐
2.2亿月活背后的野心:豆包内测AI电商,“一句话下单”电商闭环
字节跳动AI助手豆包于2026年3月启动AI电商功能灰度测试,将大模型深度融入电商交易。该功能主打“一句话购物”,利用自然语言理解能力,用户仅需模糊表达需求,系统即可精准匹配商品、提供建议并直达下单,大幅简化购物流程。截至2025年底,豆包月活用户已达2.26亿。
2026年3月20号 9:29
139.5k
中国模型登顶!阿里通义千问 3.5-Max 震撼亮相:全球排名跃升第五
阿里千问家族推出旗舰模型Qwen3.5-Max-Preview,在LM Arena全球大模型竞技平台以1464分综合得分亮相,使阿里通义千问在全球大模型公司排行榜中升至第五位,稳居中国首位,标志着国产大模型在全球竞争中已进入顶尖行列。
2026年3月20号 8:58
144.1k
“日本最大”模型竟是套壳?乐天 AI 3.0 陷入 DeepSeek 搬运风波
日本乐天集团发布号称国内最强自研大模型,但开源社区发现其底层架构文件指向中国团队开发模型,引发套壳争议。
2026年3月19号 18:03
221.0k
万亿参数!小米三款 MiMo-V2 大模型齐发:雷军宣布追投 160 亿冲刺 AI
小米于2026年春季发布三款自研大模型,包括MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS,标志着其全面进军“智能体时代”。创始人宣布,小米今年在AI领域的研发和资本投入将超过160亿元,并透露万亿参数大模型MiMo-V2-Pro在全球大模型竞争中展现技术实力。
2026年3月19号 14:23
193.9k
阿里 CEO 吴泳铭亲自挂帅!“悟空”事业部立项:AI 转型下半场的生死突围
阿里成立ATH事业群,由CEO亲自挂帅,整合通义实验室、MaaS、千问、AI创新及悟空事业部,旨在应对AI行业“模型过剩、场景饥渴”现状,从“卷参数”转向“卷应用”,发力下半场竞争。
2026年3月19号 11:47
163.9k
