多模态AI龙头ElevenLabs重磅官宣:全新「Image & Video平台」正式上线!这不再是单纯的语音工具,而是一座集图像生成、视频生成、声音合成、音乐创作、音效设计于一体的超级AI内容工厂。至此,创作者与营销人员彻底告别多平台来回切换,一键搞定从剧本到成品级的商业视频!

image.png

一站闭环:从零到成品视频,只需一个平台

新平台将视觉生成与ElevenLabs引以为傲的音频能力彻底打通:用户先生成画面与动态视频,再直接在同一界面叠加专业级旁白、背景音乐、环境音效,整个流程零缝隙衔接。官方宣称,从概念到可直接投放的营销视频,最快只需几分钟,彻底重新定义AI内容生产效率。

模型天团集结:顶级视觉+顶级听觉同框

Image & Video平台一次性集成全球最强多模态模型矩阵,包括:

Google Veo(超长一致性视频)

OpenAI Sora(电影级画面质感)

Kling(超现实物理动效)

Nanobanana、Flux Kontext、Seedream等新锐黑马Nanobanana、Flux Kontext、Seedream 等新锐黑马配合ElevenLabs自研的全球最自然AI语音与最新音乐生成模型,用户可随心所欲混搭“最强视觉”与“最强听觉”,生成效果远超单一模型拼凑。

专为商业而生:营销人看了沉默,短视频博主看了流泪

平台明确面向创作者与营销人员深度优化:

支持直接输出竖屏/横屏多种比例,适配抖音、小红书、TikTok、YouTube

内置商业安全语音与音乐库,生成内容可直接用于广告投放

一键替换旁白语言,轻松做出多语种版本

提供完整时间线编辑器,支持精确到帧的音画同步调整

实际效果炸裂:30秒品牌广告5分钟出片

据官方演示案例,仅用一段30秒文案,即可在平台内完成:

生成品牌故事板图像 →2. 转为流畅视频 →3. 添加CEO级别自然旁白 →4. 叠加情绪化背景音乐+环境音效 →5. 导出4K商用成品全程无需Premiere、Midjourney、Runway、Suno来回倒文件。

AIbase 编辑部点评:

ElevenLabs此举直接把“文本到视频”的天花板又抬高了一大截,更可怕的是它把最难的音画同步问题一次性解决。当视觉生成与声音生成两大王者合体,独立创作者与中小企业将迎来真正的降维打击时代。想知道这波更新会让多少剪辑师与配音员“失业”?

体验地址:https://elevenlabs.io/image-video