正文

超越 Transformer 架构？Inception 发布全球首个基于扩散模型的推理大模型 Mercury 2

发布于AI新闻资讯

发布时间 :2026年2月25号 9:57

阅读 :1分钟

人工智能初创公司 Inception Labs 近日宣布推出 Mercury2，这不仅是一个性能强劲的推理模型，更在底层架构上实现了一次大胆的“范式转移”。

该模型彻底弃用了目前主流的 Transformer 架构，转而采用扩散模型（Diffusion-based）来生成文本，试图打破传统大模型的性能瓶颈。

与传统模型逐个生成 Token（字符）的方式不同，Mercury2的工作原理更像是一位经验丰富的编辑。它不再是一个字一个字地往外蹦，而是能够同时对多个文本块进行全局优化和重写。这种并行处理的逻辑，让 Mercury2在处理复杂逻辑推理任务时，展现出了令人惊叹的速度优势。

根据 AIbase 获取的实测数据，在英伟达 Blackwell GPU 的驱动下，Mercury2的生成速度达到了惊人的每秒1009个 Token。在端到端延迟测试中，该模型仅需1.7秒即可完成响应，这一表现比谷歌的 Gemini3Flash 快了8倍以上，更是远超 Anthropic 的 Claude Haiku4.5。尽管速度极快，但在 GPQA Diamond 和 AIME 等权威推理基准测试中，它的质量依然能与当前顶尖的轻量化推理模型并驾齐驱。

在商业策略上，Inception Labs 采取了极具竞争力的定价方案，其输入与输出成本仅为同类竞品的四分之一。目前，Mercury2已正式开放 API 接口，并支持12.8万 Token 的超长上下文及工具调用功能。对于追求极致响应速度的语音助手、搜索系统及编程工具而言，这款“不走寻常路”的扩散推理模型无疑提供了一个极具吸引力的新选择。

概要:

🌀 架构底层革新:摒弃传统的逐字生成模式，采用扩散模型技术，支持同时对多个文本块进行全局优化，实现推理逻辑的质变。
⚡ 极致性能表现:在最新硬件加持下实现秒级响应，生成速度破千 Token/s，延迟表现大幅优于 Gemini3和 Claude4.5。
💰 高性价比商用:以极低的价格成本挑战现有市场格局，支持长文本与 API 接入，重点瞄准延迟敏感型的企业级 AI 应用。

腾讯上线AI应用生成平台“吐司”：把奇思妙想，做成你自己的 App

腾讯内部孵化的“吐司”应用生成产品于5月15日悄然上线，定位为“应用生成及灵感共创平台”。用户只需用自然语言描述想法，AI即可自动拆解功能、生成原型，并一键打包成App安装至手机。安卓版已在应用宝和官网首发，iOS版稍后推出。

2026年5月18号 10:55

157.2k

《金融时报》认证：中国视频生成AI领先美国！

字节跳动Seedance 2.0凭借卓越生成质量与创作友好性，在全球视频生成领域领先美国对手。其核心优势在于数据壁垒和工程能力形成的护城河，由字节跳动独特的技术积累驱动。这标志着中国AI公司从“能跑”到“好用”的格局重构，数据、算法与场景共同推动创新。

2026年5月18号 10:48

121.8k

ChatGPT上线个人理财工具：连接1. 2 万家金融机构，OpenAI正式切入"钱袋子"赛道

OpenAI面向ChatGPT Pro用户推出个人理财工具，通过Plaid连接超1.2万家金融机构，支持消费分析、投资组合、订阅管理及财务规划。此举标志AI从通用能力向垂直金融领域深耕，进入高价值、高敏感决策场景。

2026年5月18号 10:17

83.3k

视频生成的新势力：Runway 如何打破硅谷常规挑战谷歌

Runway公司凭借创新的视频生成技术迅速崛起，三位创始人来自纽约大学电影艺术学院，背景独特。其核心理念认为下一代人工智能将超越文本数据，重点转向视频和世界模型，挑战传统硅谷巨头。

2026年5月18号 10:15

97.4k

AI当家做主六个月:克劳德闹罢工、Grok 飙代码，只有GPT在认真“打工”

人工智能初创公司Andon Labs进行了一项为期六个月的实验，让Claude、GPT、Gemini和Grok四大AI模型在相同初始条件下自主运营网络电台，包括相同的提示词、20美元预算及完全控制权。结果，各模型在无人干预后表现出截然不同的极端行为，从混乱到高效，凸显了AI自主运行中的不可预测性。

2026年5月18号 9:53

142.3k

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご