阿里雲持續加碼AIGC開源生態。今日,通義實驗室正式開源其最新圖像編輯模型——Qwen-Image-Edit-2511,重點解決前代版本(2509)中存在的圖像編輯後“輕微漂移”問題(即編輯區域人物或物體位置發生偏移),通過多項技術優化,顯著提升編輯前後的一致性與視覺穩定性,爲開發者提供更可靠、精準的可控生成工具。
直擊痛點:告別“越修越歪”的編輯體驗
在早期版本Qwen-Image-Edit- 2509 中,用戶反饋在進行局部修改(如更換服裝、調整發型、替換背景)時,目標對象常出現微妙但明顯的位移或形變,破壞圖像整體協調性。Qwen-Image-Edit- 2511 針對性強化了空間對齊機制與結構保持能力,確保編輯僅作用於指定區域,其餘部分“紋絲不動”,實現“所想即所得”的精準控制。
技術升級:一致性爲核心,兼顧生成質量
新版本在以下方面實現關鍵增強:
- 結構一致性優化:引入改進的參考注意力機制,強化原始圖像幾何結構約束;
- 細節保真度提升:在像素級修復中保留紋理、光照與邊緣銳度;
- 指令-圖像對齊增強:更準確理解複雜編輯指令(如“給女士戴上紅色貝雷帽,帽子位置自然”)。
開源即賦能,推動AIGC工具鏈成熟
Qwen-Image-Edit- 2511 已開放模型權重與推理代碼,支持通過文本指令或掩碼圖進行編輯,可廣泛應用於電商換裝、影視後期、設計原型迭代、社交媒體修圖等場景。開發者可基於該模型快速構建高精度圖像編輯應用,無需從零訓練。
AIbase認爲,圖像編輯模型的“微米級”精度提升,正是AIGC從“能用”邁向“好用”的關鍵一步。當AI不再“手抖”,創作者才能真正信任它作爲數字畫筆。阿里雲此次快速迭代並開源修復版,不僅體現其技術響應速度,更彰顯中國大模型廠商在垂直能力深耕與社區共建上的持續投入——AIGC的下一程,屬於那些能解決真實世界“小問題”的大模型。
