随着大模型技术突飞猛进,图片放大变高清已成常态,但视频高清化仍是一大挑战。近日,香港理工大学与OPPO研究院联合推出开源框架DLoRAL,基于扩散模型(Diffusion Model),实现一步生成高质量视频,打破传统多次迭代的低效瓶颈,为视频超分辨率领域带来新突破。
DLoRAL的技术架构独具匠心。首先,它采用双LoRA架构:C-LoRA专注于维持视频帧间的时间一致性,确保画面流畅无闪烁;D-LoRA则负责增强空间细节,提升清晰度和锐利度。其次,框架引入双阶段训练策略,分为一致性阶段和增强阶段。一致性阶段优化时间连贯性,防止相邻帧跳跃;增强阶段聚焦高频信息,显著提升画面细节表现。
得益于这些创新,DLoRAL在保持视频流畅性的同时,大幅提升清晰度和细节,性能超越传统视频超分辨率方法,且推理速度提升约10倍。作为开源项目,DLoRAL为研究者和开发者提供高效工具,助力视频内容创作迈向新高度。