中國電信人工智能研究院(TeleAI)發佈了一項突破性的生成式視頻壓縮技術——GVC(Generative Video Compression)。該技術將視頻數據的壓縮率提升到了驚人的 0.02%,意味着原本1GB 大小的視頻文件,理論上僅需傳輸約200KB 的數據即可還原觀看,且畫質依然清晰。

image.png

這項技術的核心邏輯被稱爲“用計算換帶寬”。與傳統視頻編碼(如 H.265或 H.266)依靠“搬運像素”的邏輯不同,GVC 不再傳遞完整的畫面像素,而是傳遞“如何畫出畫面”的指令。這些極小的數據包被稱爲“壓縮 Token”,其中包含了畫面的語義信息(場景、物體結構)和運動信息(動作趨勢)。

在接收端,預訓練的生成式模型會扮演“畫師”的角色。它根據收到的 Token 指令,結合自身掌握的海量世界知識(如海浪、足球的視覺特徵),實時“腦補”並生成出連貫、真實的視頻畫面。這種模式直接繞過了傳統技術在極低帶寬下容易出現的畫面崩盤和卡頓問題。

根據 TeleAI 發佈的技術報告,GVC 在權威數據集上的測試表現遠超傳統算法。在同等視覺質量下,傳統方法消耗的帶寬是 GVC 的6倍以上。目前,該模型已能在消費級顯卡(如 RTX4090)上實現接近實時的生成速度。這項技術未來有望在遠洋通信、應急救援、深空探測等極端網絡環境下,解決高清視頻傳輸的燃眉之急。

    技術報告地址:

    https://www.arxiv.org/abs/2512.24300

劃重點:

  • 📉 極致壓縮: 技術將視頻壓縮率幹到了0.02%,讓1GB 視頻通過200KB 數據量即可在接收端還原呈現。

  • 🧠 邏輯轉變: 改變了傳統的像素搬運模式,通過傳輸高維語義 Token 並利用生成式 AI 在終端“重繪”視頻。

  • 場景廣泛: 針對極低帶寬環境設計,可應用於衛星通信、遠洋航行及災難現場救援等極端信號場景。