6月6日、字節跳動Seedチームは正式に画像編集モデルSeedEdit3.0をリリースしました。この新しいバージョンの画像編集モデルは、画像主体の維持、背景の詳細な処理、指示の遵守などにおいて顕著な進歩を遂げており、画像編集の利用可能性と効率を大幅に向上させています。

SeedEdit3.0は、文生成画像モデルSeedream3.0に基づいて開発されており、多様なデータ統合手法と特定の報酬モデルの導入により、従来の画像編集モデルが抱えていた主体と背景の維持や指示の遵守に関する問題を解決しました。このモデルは4K解像度の画像を処理・生成することができ、編集領域の細部処理と非編集領域の高精度保持で優れたパフォーマンスを示しています。特に人物編集、背景変更、視点や光の変換などの複雑なシナリオでは、SeedEdit3.0が卓越した能力を発揮しています。

例えば、画像内の不要な通行人の削除タスクにおいて、SeedEdit3.0は関係のない人物だけでなくその影までも正確に認識し削除することができ、詳細な処理能力を示しています。また、2D絵画をリアルなモデルに変換するタスクでは、このモデルは人物の服装や持ち物などのディテールを良好に保持し、ファッションのストリートスタイル感を兼ね備えた画像を生成します。さらに、SeedEdit3.0は複雑な光と影の変化にも対応でき、近くの建物から遠くの波打つ海のディテールも合理的に保持し、光の変化に合わせて「ピクセル単位」でのレンダリング調整を行います。

微信截图_20250606140616.png

これらの能力を実現するために、Seedチームは開発プロセスで効率的なデータ統合戦略を提案し、さまざまな専用報酬モデルを構築しました。これらの報酬モデルを拡散モデルと連携してトレーニングすることで、顔の整列やテキストレンダリングなど重要なタスクの編集品質を针对性に改善しました。また、SeedEdit3.0は推論の高速化にも取り組み、10秒程度での高速推論を実現しました。

SeedEdit3.0のパフォーマンス評価では、チームが数百枚の実際のテスト画像と合成された画像を集め、23種類の編集操作サブタスク(スタイル化、追加、置き換え、削除、カメラモーション、物体の移動、シーン切り替えなど)を構築しました。機械評価の結果では、SeedEdit3.0は編集維持効果と指示に対する反応能力において、以前のバージョンや他の類似モデルよりも優れていました。人間による評価でも、SeedEdit3.0の画像維持能力が最も際立っており、可用性は56.1%に達し、以前のバージョンと比較して大幅な向上を示しました。

SeedEdit3.0のリリースにより、画像編集技術はAI分野でさらなる重要な進展を遂げました。このモデルは技術的に多くの革新を実現しただけでなく、実際の応用においても非常に実用的で効率的です。現在、SeedEdit3.0の技術レポートは公開され、即夢ウェブエンドでテストが開始されています。また、豆包アプリもまもなくリリースされます。ユーザーは参考図をアップロードし、修正プロンプトを入力することで、この強力な画像編集ツールを体験できます。

プロジェクトホームページ:

https://seed.bytedance.com/seededit

技術レポート:

https://arxiv.org/pdf/2506.05083

体験エントリ:

即夢ウェブエンド-画像生成-参考図のアップロード-3.0モデルの選択-修正プロンプトの入力(グレー試験中);

豆包アプリ-AI画像生成-参考図の追加-修正プロンプトの入力(まもなくリリース)。