迪士尼研究部門近日發佈了一項創新的圖像壓縮技術,該技術在保持較低數據傳輸率的同時,能夠生成更爲逼真的圖像效果。
這項新型編解碼技術雖然在複雜度上較傳統的JPEG和AV1等編解碼器有所提升,但在圖像質量和處理效率方面都展現出顯著優勢。研究團隊發現,通過將量化誤差與圖像處理中的噪聲處理相結合,可以在目標比特率下更好地重建圖像細節。

迪士尼壓縮方法與之前方法的比較。作者聲稱細節恢復效果有所改善,同時提供了一種不需要數十萬美元訓練的模型,並且運行速度比最接近的等效競爭方法更快。
研究人員表示,新技術只需執行不到10%的完整處理流程,且無需對系統架構進行重大改動。在實際測試中,即使其他壓縮方法使用兩倍的比特率,該技術重建的圖像質量仍更受最終用戶歡迎。
然而,該技術也存在一些侷限性。在某些特定情況下,重建的圖像可能會出現細微的不準確,例如直線輕微彎曲或小物體邊界略有扭曲。這些問題主要源於系統特徵維度的限制。
在實際應用測試中,研究團隊採用了多個數據集進行評估,包括Kodak、CLIC2022和COCO30k。評估指標涵蓋了峯值信噪比(PSNR)、學習感知相似性指標(LPIPS)、多尺度結構相似性指數(MS-SSIM)和Fréchet初始距離(FID)等多個維度。

進一步比較迪士尼的新方法(以綠色突出顯示)與其他方法的對比。
用戶研究採用了強制選擇方法,通過類似國際象棋錦標賽的Elo評級系統進行評估。結果顯示,即便在競爭對手使用兩倍數據量的情況下,迪士尼的新技術仍然獲得了明顯更高的用戶評分。
在處理速度方面,新技術相比主要競爭對手提升顯著,處理時間從6.87秒縮短至3.49秒。這一效率的提升,加上出色的壓縮效果,使該技術在圖像存儲和傳輸領域具有重要的應用價值。
值得注意的是,圖像壓縮技術的發展對於解決全球數據存儲、流媒體傳輸和能源消耗等問題具有重要意義。雖然最佳技術方案並不總能獲得最廣泛的市場認可,但迪士尼的這項創新爲業界提供了一個在效率和性能之間取得良好平衡的解決方案。
