正文

阿里EMO框架增强视频生成技术，实现角色化身唱歌和口型视频生成

发布于AI新闻资讯

发布时间 :2024年2月29号 16:11

阅读 :1分钟

阿里的EMO框架通过关注音频提示和面部动作之间的联系，增强了头部视频生成的真实度、自然度和表现力。EMO支持不同语言的歌曲和口语音频生成，可以让角色化身具有丰富的表情和动态。此外，EMO还能实现不同角色之间的联动，为视频生成带来更多可能性。

消息称阿里将推出千问办公，整合三款智能体布局AI办公市场

据《财经》报道，阿里计划推出“千问办公”产品，已整合QoderWork、悟空、MuleRun三款智能体，主攻Agent办公市场，推动企业AI落地。产品由钉钉新任CEO陈宇森负责，他6月接替原CEO陈航，7月统一接管上述三款产品，形成阿里在Agent办公的重要布局。

2026年7月21号 15:42

239.8k

阿里发布Qwen-Image-3.0，支持4.5K Token超长输入与复杂图文生成

阿里发布Qwen-Image-3.0图像生成基础模型，支持最长4.5K Token文本输入，可一次性生成公式、几何图形、逻辑推导及多层UI等复杂内容，原生兼容12种语言和20余款字体渲染，文本长度较上代提升4.5倍，大幅强化影视分镜、知识图解等商业级图文创作能力。

2026年7月21号 15:16

248.3k

阿里发布Token Plan个人版，Qwen3.8-Max-Preview同步上线

阿里正式推出Token Plan个人版，并开放2.4万亿参数大模型Qwen3.8-Max-Preview抢先体验。该模型在代码与办公场景表现突出，正式版将开源。用户可通过Token Plan获取模型使用权限，阿里同步推出限时优惠：个人版Lite套餐39元/月，Standard套餐139元/月，Pro套餐499元/月；团队版提供标准及高阶方案。

2026年7月20号 10:42

288.4k