阿里的EMO框架通过关注音频提示和面部动作之间的联系,增强了头部视频生成的真实度、自然度和表现力。EMO支持不同语言的歌曲和口语音频生成,可以让角色化身具有丰富的表情和动态。此外,EMO还能实现不同角色之间的联动,为视频生成带来更多可能性。
相关推荐
中国AI视频生成模型异军突起,创作者赞其“更自由”
中国人工智能公司在视频生成领域领先,字节跳动、快手等企业凭借海量短视频库训练系统,在广告、电商、娱乐等场景中占据优势。中国工具获全球创作者认可,而美方模型表现不佳。
2026年5月18号 15:00
201.4k
《金融时报》认证:中国视频生成AI领先美国!
字节跳动Seedance 2.0凭借卓越生成质量与创作友好性,在全球视频生成领域领先美国对手。其核心优势在于数据壁垒和工程能力形成的护城河,由字节跳动独特的技术积累驱动。这标志着中国AI公司从“能跑”到“好用”的格局重构,数据、算法与场景共同推动创新。
2026年5月18号 10:48
177.0k
腾讯混元开源视频生成加速方案,11. 8 倍提速,被CVPR2026 收录
腾讯混元团队开源视频生成加速方案DisCa,通过可学习特征缓存技术,在已蒸馏的少步模型上进一步压缩推理成本,提升生成速度。该方案代码与模型权重已公开,并被CVPR2026收录。
2026年4月16号 15:16
281.9k
阿里ATH事业群HappyHorse模型登顶AI视频榜,Elo积分力压Seedance2.0
国产多模态模型“HappyHorse-1.0”在文本转视频评测中以1332分登顶,领先字节跳动模型近60分。其海外社交账号首位关注者为阿里巴巴,暗示其研发背景。
2026年4月10号 9:48
225.7k
千问 3.6 正式发布:100 万长上下文,硬刚 Claude Code
阿里发布新一代大语言模型Qwen3.6-Plus,被誉为当前最强国产编程模型。相比3.5版本性能显著提升,在多项编程评测中位居国产首位,整体能力接近国际标杆Claude系列。该模型在前端开发、复杂仓库任务等方面展现出高度自主化能力。
2026年4月3号 7:01
729.9k
