正文

阿里推出基于音频驱动的AI视频生成器EMO

aibase

发布于AI新闻资讯

发布时间 :2024年2月29号 13:39

阅读 :1分钟

阿里最新推出的基于音频驱动的肖像视频生成框架EMO，可以根据输入音频生成任意持续时间的视频。该框架由阿里巴巴智能计算研究院团队开发，是一种富有表现力的视频生成技术。EMO与之前的AI视频生成方法相比有较大提升，但也存在耗时较长的缺点。团队成员包括薄列峰等人，他们在论文中详细介绍了EMO的技术路线和特性。这一新技术为AI领域带来了新的突破，让人们对未来的发展充满期待。

相关推荐

国产 AI 大模型集体“爆发”:技术登顶，资本热捧

国产AI大模型迎来突破，智源研究院的“Emu3”模型登上《自然》期刊，实现中国大模型领域首次国际顶尖学术认可，标志着底层架构创新取得重大进展。

2026年2月4号 10:40

千问PC和网页端上线国内最强推理模型，主动性更强、擅长逻辑推理

阿里发布旗舰推理模型Qwen3-Max-Thinking，参数量超万亿，预训练数据达36T Tokens。该模型通过强化学习训练，在事实知识、数学推理等方面表现优异，已接入千问PC端和网页端，App即将支持。用户可一键切换体验更强推理能力。

2026年1月27号 12:30

千问全面接入阿里生态:点外卖、买机票一句话搞定，开启“AI 办事”时代

阿里千问App全面接入淘宝、支付宝等核心业务，上线超400项AI办事功能，支持全球用户通过一句话指令完成点外卖、购物等操作，实现AI交互新突破。

2026年1月15号 11:22

阿里 Qoder 升级补全功能，AI 代码采纳率大幅提升65%

阿里Qoder升级为Qoder NEXT，智能补全功能大幅提升。它能主动感知代码库和编辑历史，分析上下文后精准推断后续联动变更，为开发者提供高效智能的编程建议。

2026年1月7号 10:54

阿里千问APP公测，与ChatGPT展开全面竞争

阿里巴巴11月17日推出“千问”APP公测版，基于开源模型Qwen3，免费结合生活场景生态，与ChatGPT竞争。管理层视其为AI时代关键战役，已上线应用商店及网页、PC版，国际版即将发布。

2025年11月17号 10:19

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2026AIBase