阿里最新推出的基于音频驱动的肖像视频生成框架EMO,可以根据输入音频生成任意持续时间的视频。该框架由阿里巴巴智能计算研究院团队开发,是一种富有表现力的视频生成技术。EMO与之前的AI视频生成方法相比有较大提升,但也存在耗时较长的缺点。团队成员包括薄列峰等人,他们在论文中详细介绍了EMO的技术路线和特性。这一新技术为AI领域带来了新的突破,让人们对未来的发展充满期待。
相关推荐
千问 3.6 正式发布:100 万长上下文,硬刚 Claude Code
阿里发布新一代大语言模型Qwen3.6-Plus,被誉为当前最强国产编程模型。相比3.5版本性能显著提升,在多项编程评测中位居国产首位,整体能力接近国际标杆Claude系列。该模型在前端开发、复杂仓库任务等方面展现出高度自主化能力。
2026年4月3号 7:01
647.6k
告别AI标准脸!阿里Wan2.7-Image发布:能写A4纸论文,还能像素级“捏脸”
阿里发布Wan2.7-Image模型,突破传统AI生图局限,告别“标准脸”实现“千人千面”。模型强化虚拟角色捏脸功能,支持从骨相、眼眸到五官细节的全方位定制,精准控制脸型、眼型等特征,提升视觉效果与个性化体验。
2026年4月1号 15:16
230.4k
打车只需“一句话”!阿里千问上线 AI 办事:本地生活流量迎来大洗牌
阿里旗下千问AI助手推出“AI打车”功能,用户通过自然语言对话即可完成叫车和行程规划。此举不仅是技术升级,更是阿里以AI原生服务重塑本地生活流量入口的关键布局,展现其向“全能助理”进化的战略加速。
2026年3月23号 15:59
225.7k
阿里 CEO 吴泳铭亲自挂帅!“悟空”事业部立项:AI 转型下半场的生死突围
阿里成立ATH事业群,由CEO亲自挂帅,整合通义实验室、MaaS、千问、AI创新及悟空事业部,旨在应对AI行业“模型过剩、场景饥渴”现状,从“卷参数”转向“卷应用”,发力下半场竞争。
2026年3月19号 11:47
178.0k
通义千问核心骨干“跳槽”字节:大模型人才争夺战再次升级
阿里通义实验室近期进行架构调整,原Qwen团队被拆分,引发人才流动。继林俊旸离职后,原Qwen大模型后训练负责人郁博文也加盟字节跳动,担任Seed团队视觉模型与多模态交互团队的后训练负责人。这反映出国内大模型领域人才竞争加剧,行业格局正经历新一轮重构。
2026年3月12号 15:30
250.1k
