近日,研究人员提出了一种名为 Voost 的创新框架,旨在提升虚拟试衣和试脱技术的表现。虚拟试衣是指合成一个人穿着目标服装的真实图像,但由于姿态和外观的变化,准确建模服装与身体的对应关系一直是一大挑战。Voost 的推出为这个难题提供了新的解决方案。

image.png

Voost 是一个统一且可扩展的模型,通过一个单一的扩散变换器(DiT)共同学习虚拟试衣和试脱任务。与传统方法不同,Voost 能够让每对服装和人进行双向监督,从而增强服装与身体的关系推理,而无需依赖特定任务的网络、辅助损失或额外的标签。这个特点使得 Voost 在任务的灵活性和生成的多样性上表现出色。

此外,研究团队还引入了两种推理时的技术来提升模型的鲁棒性。一是注意力温度缩放技术,能够在分辨率或遮罩变化的情况下保持模型的稳定性;二是自我校正采样,通过利用任务之间的双向一致性,进一步优化生成结果。这些创新技术使得 Voost 在推理过程中能够适应不同的输入情况。

image.png

在大量实验中,Voost 表现优异,达到了虚拟试衣和试脱基准测试的最新水平。研究结果显示,Voost 在对齐准确性、视觉逼真度以及泛化能力等多个方面,均显著超过了许多强基线模型。这一成果不仅为虚拟试衣和试脱技术的发展提供了新的方向,同时也为未来相关领域的研究奠定了基础。

Voost 的成功展示了深度学习技术在服装试穿体验上的潜力,预示着我们在数字时尚和在线购物领域可能会迎来新的变革。

项目:https://nxnai.github.io/Voost/

划重点:

🌟 Voost 是一种新的框架,通过单一的扩散变换器实现虚拟试衣和试脱的共同学习。  

🔍 Voost 在任务灵活性和生成多样性上表现出色,且无需特定的网络和额外标签。  

🚀 实验结果显示,Voost 在准确性和视觉质量上优于现有的多种强基线模型。