12月4日凌晨、字節跳動傘下シードチームは「Seedream4.5」を静かにリリースしました。これは今年8月にリリースされた「Seedream4.0」に続く、また一つの重要なアップデートです。公式では今回のアップデートは「複数画像シーンの一貫性」と「美学指示の遵守」を強調しており、実際のテスト結果ではこれまで画像モデルで最も悩ましかった「精神分裂状態」の問題を完全に解消したとされています。

複数画像の融合が崩れない:キャラクターや衣装、光と影、構図が高度に統一
過去のほとんどの画像モデルは複数画像生成時に「同じ人物でも顔が異なる」「服の色が勝手に変わる」「光の方向が乱れる」などの深刻な問題を抱えていました。Seedream4.5は新設計された「跨図一貫性モジュール」により、同一のバッチで生成される複数の画像において、キャラクターの身分、衣装の細節、シーンの照明、アートスタイルなどが高い一貫性を実現しています。
実際のテスト結果によると:
- 同じキャラクターが9マスの中で目や髪型、顔の特徴がほぼゼロの誤差;
- 複雑な衣装のテクスチャが、さまざまな角度や動作で完全に一致;
- 光の方向、トーン、雰囲気がすべてのサブ画像で厳密に統一。
業界関係者は「これは本物の『大量生産型映画クオリティの原稿』だ」と語っています。
美学指示の遵守が大幅に向上:あなたが言うようにする
Seedream4.5は美学制御においても飛躍的な進歩を遂げました。例えば「サイバーパンク夜景+フィルムの粒感」「韓系インスタ風+クリーム光」や「90年代香港風雑誌カバー」など、モデルは正確にスタイルのキーワードを捉え、以前のような「理解の誤差」や「スタイルの混ざり」が起こらなくなりました。
特に複雑な修飾語が重なった場合(例:「霧が漂う朝の森、映画のようなクールトーン、フィルムの粒、フジスーパーリアトーン」)において、画質と説明との一致度は現在公開されているモデルの中でも最高水準に達しています。
Flux、Midjourney v6.1に挑む:ディテールコントローラーにとっての福音
現在の主流のトップモデルと比較すると、Seedream4.5は手の描写、文字のレンダリング、複雑な服のしわなどの伝統的な難題において明らかに欠点がありません。今回の「複数画像一貫性」の強化に加え、ECポスター、IPキャラクターの大量出力、イラストレーターのコンセプト案の迅速なイテレーションなどの商業的場面で決定的な優位性を持っています。
AIbase独自のコメント
誰もがビデオモデルの戦いに注目している中、字節は一枚の静止画で「一貫性」という画像生成の最後かつ最も難しいピースを完璧に補いました。Seedream4.5はパラメータの軍備競争には手を出さず、業界で最も悩み苦しんでいる実際の課題を正確に解決しました。これこそが中国チームが持つ最も本格的な「競争力」です。
複数画像の崩れなし+美学の完成度高まり、字節はこの回で画像生成の「天井」をさらに上げてしまいました。
2025年の画像生成の世界は本当にエキサイティングになってきています。
