商湯科技が「悟能(モウノう)」エージェント型スマートプラットフォームを発表し、スマート端末分野に新たな変革の力を持ち込みます。

「悟能」エージェント型スマートプラットフォームは、商湯のエージェント型世界モデルをコアエンジンとしており、商湯の大装置が端末側とクラウド側の強固な計算力のサポートを提供しています。この強力なコンビネーションにより、ロボットやスマートデバイスに優れた認識能力、視覚ナビゲーションおよびマルチモーダルインタラクション機能を提供し、スマート端末の自律性と知能レベルをさらに高めることを可能にします。

商湯科技

このプラットフォームは優れた支援能力を持ち、ロボットなどのさまざまな端末ハードウェアを広く支援し、それらが世の中のあらゆるものを正確に認識し深く理解するのを助けます。また、特に注目すべき点は、エッジチップに埋め込むことができ、非常に高いシーン適応性を備えていることで、どんな複雑な環境でも安定した動作を実現できます。

商湯のエージェント型世界モデルの強力な機能はこれにとどまりません。多視点ビデオの生成も可能であり、ビデオが時間的・空間的に高い一貫性を保つことを確保します。この特徴により、機械が現実世界を深く理解し、生成し、編集できるようになり、空間面での現実世界との深いインタラクションが可能になります。「現実の街で『Need for Speed(ニード・フォー・スピード)』を遊ぶ」といったアイデアが現実のものになることが可能となり、ゲームや映画などさまざまな業界に無限の想像力をもたらします。

さらに、このモデルは人、物、場を対象とした4Dリアルワールドを構築することができます。ユーザーが単純なヒントワードを入力するだけで、「キッチンエリアの棚を探して」「リビングルームに入り、右に曲がって、庭へのドアを開ける」など、エージェント型世界モデルは自ら姿勢、動作の骨格、命令を生成することができ、人間と機械のインタラクションの障壁を大幅に低減し、インタラクションの使いやすさと知能性を向上させます。