相关推荐
输入分镜脚本,几秒生成1分钟连贯叙事视频!字节开源StoryMem,让AI视频角色永不“变脸”
字节跳动与南洋理工大学联合推出开源框架StoryMem,通过创新的“视觉记忆”机制,将单镜头视频扩散模型升级为多镜头长视频生成工具,能自动生成超过1分钟、镜头切换自然、角色场景连贯的叙事视频,推动开源AI视频技术向电影级叙事迈进。
2025年12月29号 10:09
260.4k
清华开源TurboDiffusion,AI视频生成速度暴增200倍,消费级显卡也能秒出大片!
清华大学TSAIL实验室与生数科技联合开源视频生成加速框架TurboDiffusion,将AI视频扩散模型的推理速度提升100至200倍,视觉质量几乎无损。该技术针对现有开源模型进行深度优化,在单张RTX 5090显卡上实现从分钟级到秒级的实时生成,标志着AI视频创作进入新时代。
2025年12月25号 14:52
162.9k
告别僵硬AI视频!快手Kling2.6让你的声音"活"在AI角色里,复杂舞蹈动作也能完美复刻
快手Kling 2.6版本推出语音与动作控制两大功能,实现原生音频生成并提升复杂动作处理精度。语音控制可生成匹配视频的音效、人声和音乐,支持个性化声音定制。
2025年12月22号 9:56
203.2k
Luma发布Ray3 Modify:AI视频编辑新突破,保留演员表演细节,一键换装、换场景
Luma AI推出Ray3Modify模型,实现高保真AI视频修改,可更换角色、服装、场景并生成过渡镜头,同时完整保留演员动作、眼神和情感表达,解决了传统AI工具难以保持表演一致性的痛点。
2025年12月19号 13:46
170.4k
苹果发布全新多模态 AI 模型 UniGen 1.5,实现图像理解、生成与编辑三合一
苹果推出多模态AI模型UniGen1.5,整合图像理解、生成与编辑三大功能于统一框架,显著提升效率。该模型利用图像理解能力优化生成效果,实现技术突破。
2025年12月19号 9:26
171.4k
