在人工智能领域,技术迭代的速度总是令人惊叹。快手旗下AI视频生成工具可灵(Kling)在短短半年内,从追赶者一跃成为全球AI视频生成领域的领跑者。最新发布的1.6版本,展现了令人瞩目的技术进步。
尽管版本号仅提升了0.1,但可灵1.6版带来的技术突破却远超预期。新版本在保持35灵感/5秒视频的亲民价格基础上,在三个核心维度实现了质的飞跃:物理规律真实感、人物表演能力和语义理解水平。


在人工智能领域,技术迭代的速度总是令人惊叹。快手旗下AI视频生成工具可灵(Kling)在短短半年内,从追赶者一跃成为全球AI视频生成领域的领跑者。最新发布的1.6版本,展现了令人瞩目的技术进步。
尽管版本号仅提升了0.1,但可灵1.6版带来的技术突破却远超预期。新版本在保持35灵感/5秒视频的亲民价格基础上,在三个核心维度实现了质的飞跃:物理规律真实感、人物表演能力和语义理解水平。

字节跳动Seed团队发布新一代视频创作模型Seedance2.0,采用统一的多模态音视频联合生成架构,推动AI视频生成从“单点突破”迈向“全能协作”的工业级应用阶段。相比1.5版本,新模型在复杂交互与运动场景下的可用率显著提升,通过出色的物理还原能力,攻克了双人花滑、多人竞技等高难度动作生成难题。
字节跳动发布AI视频生成模型Seedance2.0,集成于即梦Dreamina平台。该模型支持一键将剧本和参考图转化为逻辑连贯的动态画面,显著降低视频制作门槛,实现“一个人就是一个剧组”。其剧情理解与画面表现力已接近专业水平。
马斯克旗下xAI公司发布Grok Imagine 1.0,实现AI视频生成技术重大突破。该版本支持生成10秒720p高清视频,音频质量显著提升,大幅缩短高质量视频创作时间,标志着AI视频生成领域的重要进展。
xAI旗下Grok Imagine新增10秒视频生成功能,视频质量显著提升,画面稳定、细节丰富,音频清晰同步。目前生成过程仍较随机,缺乏计时器选项,输出长度和一致性有待优化,但相关功能预计将很快完善。
Lightricks开源LTX-2模型,支持生成20秒4K高清视频,实现画面、声音、口型、环境音和音乐的完美同步。模型权重、训练代码、基准测试和工具包已全部开源,托管于GitHub,社区反响热烈。