3Dコンテンツ制作の分野において、アップルは最近「深水爆弾」を投下した。テクノロジーメディアの9to5Macによると、アップルは正式に、SHARPという新しいAIモデルを開発し、オープンソース化した。この技術が最も注目されている点は、従来の3D再構築で何時間もかかる時間が、わずか1秒で2D画像を現実的な物理スケールを持つ3Dシーンに変換できることだ。

image.png

アップルが公開した最新論文『一秒内実現可能な明瞭な単一視点合成』によると、SHARPの核心的秘密は、先進的な「3Dガウシアンスパッタリング(3Dガウシアンスプラッティング)」技術を使用していることである。これまでは数百もの角度から撮影した写真が必要だったが、SHARPは膨大なデータに基づく深いトレーニングにより、一般的な空間の幾何学的法則を習得している。これは、ニューラルネットワークによる一回の高速な「スキャン」で、数百万個の光と影の情報を備えた「ガウシアンボール」の位置を直接予測できるようになることを意味する。

画像品質においても、SHARPは業界の基準を刷新している。テスト結果によると、その生成する3Dビューは、テクスチャの細部や構造の再現度において、これまでの業界最高レベルのモデルを大幅に上回っており、非常に現実的なカメラ移動のシミュレーションをサポートしている。

image.png

現在、アップルはSHARPの完全なコードとリソースをGitHubで公開しており、世界中の開発者にダウンロード可能にしている。このモデルは現在、元画像の視点付近の再構築に焦点を当てており、背後の盲点を完全に「補完」することはできないが、ほぼリアルタイムの変換体験が提供されるため、モバイル端末での3D創作や空間計算アプリケーションに新たな可能性を開くことになるだろう。

重要なポイント:

  • スピードの段階的突破:SHARPモデルは、2Dから3Dへの処理速度を3つのオーダー以上向上させ、1秒未満のほぼリアルタイムの変換体験を実現した。

  • 🌐 先進的な3D生成技術:3Dガウシアンスパッタリング技術を基盤として、一度のニューラルネットワークフードフォワードで数百万の3Dポイントを予測し、現実的な物理スケールを正確に再現する。

  • 🔓 完全なオープンソースエコシステム:アップルはGitHubでSHARPのコードとリソースをオープンソース化し、世界中の開発者が空間計算や3Dコンテンツ分野でのイノベーションを加速することを目的としている。