昨年9月に4.0バージョンをリリースした後、バイチューテンのSeedチームは本日(2026年2月13日)、「Seedream5.0Lite」というスマートな画像制作モデルを正式に公開しました。この新モデルは単にピクセルを積み重ねるだけでなく、「マルチモーダル統一アーキテクチャ」を通じて、単なる指示の実行から深い意図の理解への飛躍を果たし、より賢く、専門的な「ビジュアルクリエイティブパートナー」として位置づけられています。

QQ20260213-133928.png

主要な技術革新:論理を理解し、世界を知る

Seedream5.0Liteの主な進化は「思考の深さ」に集中しています。その顕著な特徴には以下が含まれます:

  • 複数ステップの視覚的推論: モデルは物理法則を理解できます。例えば、囲碁の残局に基づいて次の一手を推論し、その後の局面を生成することができたり、散らばった部品図に基づいて物体の種類を推論し、適切に組み立てることが可能です。

  • リアルタイム検索強化(RAG): 連携機能が初めて導入され、モデルは天気や金価格、興行収入などの最新情報をリアルタイムで取得し、タイムリーな情報ポスターまたはトレンドグラフを正確に生成できます。

  • 豊富な世界知識: 科学や人文など多分野の知識ベースが内蔵されており、石油地質断面や熱帯雨林の階層などの専門的な情報図を作成する際に非常に高い正確性を発揮します。

クリエイティブ体験の向上:「描画」から「協働」へ

実際の応用において、Seedream5.0Liteは非常に強力な専門的な協働能力を示しています:

  1. 高次な画像編集: 模糊な指示にも対応します。ユーザーは簡単な説明や参照画像の比較を提供するだけで、モデルは意図を正確に推測し、部分的な再描写や光と影の変更、焦点調整を行いながら、編集していない領域の一貫性を保つことができます。

  2. 正確なスタイル移動: 複雑なヒントワードは必要なく、「共感」参考画像を通じて、複雑な芸術的神韻と光の描写を瞬時に捉え、移動させることができます。

  3. 複雑な複数主体の制御: 3x3の展示台や5人一緒に写っているような複雑なシナリオでは、各主体の属性(色、数字、特定の動作など)を正確に再現でき、幻覚や見落としを大幅に減らすことができます。

    QQ20260213-133955.png

    左の画像:自然生態図で、熱帯雨林の4つの垂直な層(露生層、樹冠層、灌木層、地表層)を示しています。

    中央の画像:英語の石油システムのインフォグラフィックで、石油掘削プラットフォームと地層を表示しています。

    右の画像:高校数学教科書の図解で、関数のある点における微分の幾何的意味を視覚化しています。白い背景で、線が明確で科学的に正確です。

評価結果と実装

MagicArena競技プラットフォームでの二盲対戦において、Seedream5.0LiteのEloスコアは4.5バージョンを大きく上回り、特にオフィスと学習知識推論人物像強化のシーンで大きな進歩を見せています。現在、このモデルは即夢AI火山方舟体験センターにリリースされ、また豆包でテスト版が開始されています。

バイチューテンは今後、モデルを拡大し、知能の上限を引き上げ、さらに多くのサイクルにわたるインタラクティブな編集をサポートすることで、画像生成を「クリエイティブなおもちゃ」から「生産性ツール」に真正に変革することを目指していると述べました。