アリババグループの高徳地図は、自社開発の世界モデル「FantasyWorld」を正式にリリースしました。豊富な実際のナビゲーションデータの利点を活かし、このモデルは国際的な権威ある基準であるWorldScore Leaderboardで総合スコア1位を獲得し、アリババがAI基礎モデル分野においてさらに広範な展開を進める新たな一歩となりました。FantasyWorldは高品質な3D世界構築に焦点を当てており、身体知能や自動運転分野での新たな注目を集めています。
FantasyWorldの主要技術的突破
FantasyWorldは、身体知能と汎用人工知能(AGI)のために高品質な3D世界モデルを提供することを目的としています。その革新性は、凍結されたビデオベースモデルの骨格にトレーニング可能なジオメトリブランチを追加することで、「ビデオ潜変数」と「隠れた3Dフィールド」の連携モデリングを実現し、一度の前向き計算だけで完了します。

この設計により、生成されたビデオの視覚的リアルさが大幅に向上し、多視点の一貫性とジオメトリの正確性も著しく改善されました。最近の他のジオメトリ的一貫性手法と比較して、FantasyWorldは多視点協調性、スタイルの一貫性、そして極端な視点(例えば180度回転)における物体の形状とテクスチャの保持において優れた性能を示しています。モデルによって生成された3D潜変数は、深度画像またはポイントクラウドに直接復号可能であり、下流タスクに対して追加の最適化を必要としません。
WorldScore第1位:国際的な認定の証明
WorldScoreはスタンフォード大学の李飛飛チームが主導する統一された世界生成のベンチマークで、静的・動的なシーン、制御性、一貫性など、複数の次元を評価しています。現在、FantasyWorldは総合スコアおよび重要な指標(静的世界スコア78.55、動的世界スコア66.89)において首位を維持しており、国内外の多くの競合モデルを上回っています。
関連論文はICLR2025、NeurIPS2025などのトップ会議に掲載され、高徳はモデルの公開を間近に控えていることを表明しており、今後学術界と産業界との協力をさらに促進する予定です。
実際の応用:飛行街景が空間インテリジェンスの新しい体験を牽引
FantasyWorldはすでに高徳地図の「飛行街景」機能に最初に応用されています。商家はわずかなスマートフォンの動画をアップロードするだけで、高精度の3D仮想散策風景を無料で生成できます。これはユーザーがレストランのレイアウトや座席区域などの詳細を事前に「実際に訪問しているように」理解するのを助け、同時に実店舗の集客を支援します。
この機能は「技術の平等化」の象徴と見なされており、専門的な3Dモデリングの障壁を下げています。高徳は内部的に身体知能業務部を設立し、ロボットやロボット犬などの方向性を探索しており、空間インテリジェンスを全面的に物理AIへと転換しています。
業界への影響:世界モデル時代の加速到来
自動運転がエンドツーエンドのビジュアル言語行動(VLA)ソリューションに移行し、身体知能が急速に発展する中、物理的な現実性と3Dの一貫性を持つ世界モデルがますます重要となっています。FantasyWorldの登場は、アリババがマルチモーダルAIの版図を強化するだけでなく、中国企業が現実世界のデータ駆動型の空間インテリジェンスにおける優位性を示すものでもあります。
