还在对着音乐软件 抠脚 编曲? OUT 啦! 音乐创作领域迎来 核爆级 突破! 全球首个基于扩散模型的端到端音乐模型 DiffRhythm 横空出世, 直接把音乐创作的门槛 夷为平地! 你只需要 动动嘴皮子, 输入歌词和风格,10秒钟后, 一首包含


还在对着音乐软件 抠脚 编曲? OUT 啦! 音乐创作领域迎来 核爆级 突破! 全球首个基于扩散模型的端到端音乐模型 DiffRhythm 横空出世, 直接把音乐创作的门槛 夷为平地! 你只需要 动动嘴皮子, 输入歌词和风格,10秒钟后, 一首包含

计算机视觉正从“看清世界”转向“理解与交互”。随着感知能力接近人类极限,单纯追求准确率的边际收益递减。CVPR2026标志着研究重点转向:视觉成为推理、决策与交互的中介,告别“盲目推理”,迈向自适应与隐式路径,如多模态模型通过“思维链”展开逻辑。
Inception Labs推出Mercury2模型,采用扩散模型替代Transformer架构,实现文本生成范式转移。该模型不再逐字生成,而是像编辑一样整体处理文本,旨在突破传统大模型的性能瓶颈。
数字头像生成公司Lemon Slice获1050万美元种子融资,投资方包括Matrix Partners、Y Combinator及The Chainsmokers等。公司致力于为AI聊天机器人添加视频功能,其最新扩散模型Lemon Slice-2仅需一张图片即可生成动态数字头像。该模型拥有200亿参数,可在单个GPU上实现每秒20帧的直播视频,并通过API和可嵌入小工具提供服务。
蚂蚁技术研究院发布LLaDA2.0系列,包含16B和100B版本,其中100B版为业内首个百亿参数离散扩散大语言模型。该模型突破扩散模型规模化瓶颈,显著提升生成质量与推理速度,为领域发展提供新方向。
斯坦福教授Stefano Ermon创立的AI初创公司Inception完成5000万美元种子轮融资,获Menlo Ventures领投,微软、英伟达等巨头跟投,吴恩达等AI大咖天使投资。公司以颠覆性架构突破当前自回归模型竞争格局,引发行业关注。