阿里最新推出的基于音频驱动的肖像视频生成框架EMO,可以根据输入音频生成任意持续时间的视频。该框架由阿里巴巴智能计算研究院团队开发,是一种富有表现力的视频生成技术。EMO与之前的AI视频生成方法相比有较大提升,但也存在耗时较长的缺点。团队成员包括薄列峰等人,他们在论文中详细介绍了EMO的技术路线和特性。这一新技术为AI领域带来了新的突破,让人们对未来的发展充满期待。
相关推荐
阿里ATH事业群HappyHorse模型登顶AI视频榜,Elo积分力压Seedance2.0
国产多模态模型“HappyHorse-1.0”在文本转视频评测中以1332分登顶,领先字节跳动模型近60分。其海外社交账号首位关注者为阿里巴巴,暗示其研发背景。
2026年4月10号 9:48
209.8k
千问 3.6 正式发布:100 万长上下文,硬刚 Claude Code
阿里发布新一代大语言模型Qwen3.6-Plus,被誉为当前最强国产编程模型。相比3.5版本性能显著提升,在多项编程评测中位居国产首位,整体能力接近国际标杆Claude系列。该模型在前端开发、复杂仓库任务等方面展现出高度自主化能力。
2026年4月3号 7:01
714.1k
告别AI标准脸!阿里Wan2.7-Image发布:能写A4纸论文,还能像素级“捏脸”
阿里发布Wan2.7-Image模型,突破传统AI生图局限,告别“标准脸”实现“千人千面”。模型强化虚拟角色捏脸功能,支持从骨相、眼眸到五官细节的全方位定制,精准控制脸型、眼型等特征,提升视觉效果与个性化体验。
2026年4月1号 15:16
257.6k
打车只需“一句话”!阿里千问上线 AI 办事:本地生活流量迎来大洗牌
阿里旗下千问AI助手推出“AI打车”功能,用户通过自然语言对话即可完成叫车和行程规划。此举不仅是技术升级,更是阿里以AI原生服务重塑本地生活流量入口的关键布局,展现其向“全能助理”进化的战略加速。
2026年3月23号 15:59
231.4k
阿里 CEO 吴泳铭亲自挂帅!“悟空”事业部立项:AI 转型下半场的生死突围
阿里成立ATH事业群,由CEO亲自挂帅,整合通义实验室、MaaS、千问、AI创新及悟空事业部,旨在应对AI行业“模型过剩、场景饥渴”现状,从“卷参数”转向“卷应用”,发力下半场竞争。
2026年3月19号 11:47
186.5k
