生成AI分野において、3Dコンテンツの構築が技術競争の新興分野となっています。最近、ビットテッキーは精度の高い新しい3D生成大規模モデル「Seed3D2.0」を正式に公開しました。このモデルの最新技術報告書も同時に公開され、関連するAPIインターフェースも火山エッジンプラットフォームで正式にリリースされました。

比較評価データによると、Seed3D2.0は幾何形状の生成およびテクスチャ素材モデリングという2つの重要な指標において、SOTA(現在最高)の成績を達成しました。これは、複雑な物体構造を処理する際、より細かい鋭いエッジや薄い壁構造を正確に再現できることを意味します。また、PBR(物理ベースレンダリング)素材生成においては、現行の主流モデルよりも実感性と光の安定性が顕著に優れています。

image.png

実際にユーザーの感覚を検証するために、ビットテッキーは60人の専門的な経験を持つ3Dモデラーを募り、盲検評価を行いました。純粋な幾何構造の生成テストでは、Seed3D2.0は圧倒的な優位性を示しました。一方、テクスチャマップを含む総合テストでは、業界内での他の主要モデルに対する好みの割合は69%を超え、そのアーキテクチャのイノベーションによる品質の飛躍を確認しました。

image.png

技術実装の観点から見ると、Seed3D2.0は「全体構造」と「局所的な詳細」を分離し、それぞれを別々に最適化する「粗から精へ」(Coarse-to-Fine)の2段階生成戦略を導入しています。この方法により、複雑なトポロジー構造の再現が困難だった課題を克服しました。また、モデルはMoE(Mix of Experts)アーキテクチャを使用して高解像度下での素材の詳細を向上させ、視覚言語モデル(VLM)の事前知識を取り入れることで、未知の照明環境における素材の分解の正確性を確保しています。

基本的な幾何とテクスチャ生成に加え、このモデルは強い実用性の可能性を示しています。現在、Seed3D2.0は部品レベルのセグメント補完、接続アセット生成、そしてマルチモーダル入力に基づくシーンの組み合わせ能力を備えています。これらの特徴の追加により、生成型3Dモデルは研究室の段階にとどまらず、ゲーム開発やシミュレーションシーンの構築などの実業務への直接的な応用が可能になりました。