阿里最新推出的基于音频驱动的肖像视频生成框架EMO,可以根据输入音频生成任意持续时间的视频。该框架由阿里巴巴智能计算研究院团队开发,是一种富有表现力的视频生成技术。EMO与之前的AI视频生成方法相比有较大提升,但也存在耗时较长的缺点。团队成员包括薄列峰等人,他们在论文中详细介绍了EMO的技术路线和特性。这一新技术为AI领域带来了新的突破,让人们对未来的发展充满期待。
相关推荐
国产 AI 大模型集体“爆发”:技术登顶,资本热捧
国产AI大模型迎来突破,智源研究院的“Emu3”模型登上《自然》期刊,实现中国大模型领域首次国际顶尖学术认可,标志着底层架构创新取得重大进展。
2026年2月4号 10:40
182.6k
千问PC和网页端上线国内最强推理模型,主动性更强、擅长逻辑推理
阿里发布旗舰推理模型Qwen3-Max-Thinking,参数量超万亿,预训练数据达36T Tokens。该模型通过强化学习训练,在事实知识、数学推理等方面表现优异,已接入千问PC端和网页端,App即将支持。用户可一键切换体验更强推理能力。
2026年1月27号 12:30
229.6k
千问全面接入阿里生态:点外卖、买机票一句话搞定,开启“AI 办事”时代
阿里千问App全面接入淘宝、支付宝等核心业务,上线超400项AI办事功能,支持全球用户通过一句话指令完成点外卖、购物等操作,实现AI交互新突破。
2026年1月15号 11:22
193.0k
阿里 Qoder 升级补全功能,AI 代码采纳率大幅提升65%
阿里Qoder升级为Qoder NEXT,智能补全功能大幅提升。它能主动感知代码库和编辑历史,分析上下文后精准推断后续联动变更,为开发者提供高效智能的编程建议。
2026年1月7号 10:54
174.2k
阿里千问APP公测,与ChatGPT展开全面竞争
阿里巴巴11月17日推出“千问”APP公测版,基于开源模型Qwen3,免费结合生活场景生态,与ChatGPT竞争。管理层视其为AI时代关键战役,已上线应用商店及网页、PC版,国际版即将发布。
2025年11月17号 10:19
457.2k
