Snap Inc. 的研究團隊近日推出了一款名爲 SnapGen 的人工智能圖像生成器,能夠直接在高端手機上生成高分辨率圖像。這一技術的推出,讓用戶在手機上也能享受高效便捷的圖像創作體驗,打破了傳統 AI 圖像生成需要強大計算能力的侷限。

SnapGen 的核心優勢在於其模型的緊湊性與高效性。與流行的圖像生成器如 SDXL 相比,SnapGen 的參數數量僅爲3.79億,約爲後者的七分之一。這種小巧的設計使得 SnapGen 不僅在存儲空間上佔用更少,而且在運行速度上表現更爲優異。根據測試結果,SnapGen 在圖像與文本描述匹配的能力上表現出色,得分爲0.66,超越了 SDXL 的0.55,顯示出其在質量上的明顯優勢。

image.png

在速度方面,SnapGen 的表現尤爲突出。在 iPhone16Pro Max 上,該系統能夠在約1.4秒內生成一幅分辨率爲1024×1024像素的高質量圖像。這一速度的提升使得用戶在創作過程中幾乎不會感受到延遲,能夠即時體驗到生成圖像的樂趣。

爲了實現這一系列的性能提升,研究團隊對網絡架構進行了系統性的重新設計,精簡了模型參數和延遲,同時確保圖像生成的高質量。他們特別優化了解碼器部分,使其比同類系統小36倍。此外,爲了讓小型模型的表現達到大型模型的水準,團隊還借鑑了 SD3、SD3.5等大型 AI 系統的學習方法,開發出了一套特殊的訓練流程,能夠根據任務的難易程度動態調整學習策略。

隨着 SnapGen 的問世,移動設備上的 AI 圖像生成技術迎來了新一輪的突破,未來,用戶將在手機上體驗到更快速、更高質量的圖像創作,進一步推動了社交媒體內容創作的進步。