6月6日,字節跳動Seed團隊正式發佈了圖像編輯模型SeedEdit3.0。這一全新版本的圖像編輯模型在圖像主體保持、背景細節處理以及指令遵循等方面取得了顯著進步,極大地提升了圖像編輯的可用率和效率。
SeedEdit3.0是基於文生圖模型Seedream3.0開發的,通過引入多樣化的數據融合方法和特定獎勵模型,解決了以往圖像編輯模型在主體與背景保持、指令遵循等方面的不足。該模型能夠處理並生成4K分辨率的圖像,在編輯區域的精細處理和非編輯區域的高保真保持方面表現出色。尤其在人像編輯、背景更改、視角與光線轉換等複雜場景中,SeedEdit3.0展現了卓越的能力。
例如,在移除圖片中多餘行人的任務中,SeedEdit3.0不僅能夠準確識別並移除無關人物,甚至連人物的影子也能一併去除,顯示出強大的細節處理能力。在將2D繪畫轉換爲真實模特的任務中,該模型能夠很好地保持人物的衣帽穿搭和手提包等細節,生成的圖片兼具時尚街拍感。此外,SeedEdit3.0還能處理複雜的光影變換,從近處的房屋到遠處的海水波紋,細節都能合理保留並跟隨光線變化進行“像素級”的渲染調整。

爲實現這些能力,Seed團隊在研發過程中提出了一種高效的數據融合策略,並構建了多種專用獎勵模型。通過將這些獎勵模型與擴散模型聯合訓練,團隊針對性地改善了關鍵任務的編輯質量,如人臉對齊、文本渲染等。同時,SeedEdit3.0在推理加速方面也進行了優化,使其能夠實現10秒級的快速推理。
在評估SeedEdit3.0的性能時,團隊收集了數百張真實與合成的測試圖像,並構建了23類編輯操作子任務,涵蓋風格化、添加、替換、刪除等常見操作以及相機運動、物體位移、場景切換等指令式動作。機器評測結果顯示,SeedEdit3.0在編輯保持效果和指令響應能力上均領先於此前版本以及其他同類模型。真人評測結果也表明,SeedEdit3.0的圖像保持能力最爲突出,可用率達到了56.1%,較此前版本有了顯著提升。
SeedEdit3.0的發佈,標誌着圖像編輯技術在AI領域的又一次重要進步。該模型不僅在技術上實現了多項創新,更在實際應用中展現出極高的實用性和效率。目前,SeedEdit3.0的技術報告已經對外公開,模型也在即夢網頁端開啓了測試,豆包App也即將上線。用戶可以通過上傳參考圖並輸入修改Prompt來體驗這一強大的圖像編輯工具。
項目主頁:
https://seed.bytedance.com/seededit
技術報告:
https://arxiv.org/pdf/2506.05083
體驗入口:
即夢網頁端-圖片生成-上傳參考圖-選擇圖片3.0模型-輸入修改 Prompt(灰度測試中);
豆包 App-AI 生圖-添加參考圖-輸入修改 Prompt(即將上線)。
