商湯科技がオープンソースする日日新 SenseNova U1 はマルチモーダルネイティブな統一アーキテクチャを実現

商湯科技は 28日に、日日新 SenseNova U1シリーズのネイティブな理解・生成統一モデルを公開しました。このモデルは、今年3月に自社で開発したNEO-unifyアーキテクチャを基盤としており、単一のモデルフレームワーク内でマルチモーダルな理解、推論、生成の深い統合を実現し、マルチモーダルAIのパラダイムが「統合型」から「ネイティブ統一」への重要な飛躍を示しています。

SenseNova U1で採用されているNEO-unifyアーキテクチャは、一般的なモデルで見られる結合型設計を完全に取り除き、視覚エンコーダ（VE）と変分自己符号化器（VAE）を排除し、統一された表現空間を再構築しました。このアーキテクチャにより、マルチモーダル処理が各層の計算に深く組み込まれ、言語と視覚情報が統一された複合体として直接モデリングされるようになります。これにより、意味の豊かさを保ちながらピクセルレベルの視覚の正確性も維持されます。この技術を活用することで、モデルは論理的推論と空間知能の分野で顕著な性能を発揮し、物理的な世界の複雑な構造と詳細な関係を正確に理解できます。

身体知能のトレンドの進化に伴い、商湯科技

商湯がナチュラルな理解と生成を統合したモデル SenseNova U1 を発表　プラグイン型AIから脱却

商湯科技は4月28日、「日日新SenseNova U1」シリーズをオープンソース化。これは「ネイティブ理解生成統一モデル」であり、従来のマルチモーダルモデルが異なるモジュールを「接続」する限界を突破し、統一アーキテクチャで視覚と言語モジュールの深い融合を実現。国産AIのマルチモーダル分野における重要な技術的飛躍を示す。....

商湯が本格的にオープンソース化した SenseNova-MARS：マルチモーダルな自律的推論の新時代を切り開く

商湯科技がマルチモーダル自律推論モデル「SenseNova-MARS」をオープンソース化し、8Bと32Bバージョンを提供。初のAgentic VLMとして、動的視覚推論と画像検索を統合し、画像理解と自律推論が可能で、マルチモーダル大規模モデルの発展を推進。....

商湯オープンソース SenseNova-MARS：エージェント型VLAMによりAIに独立した思考と行動力を付与

商湯科技がオープンソース化したSenseNova-MARSモデルは、動的視覚推論と画像・テキスト検索機能を備え、探偵の論理を模倣してAIが自律的に実行可能。8Bと32Bバージョンがあり、MMSearch評価で74.2点を獲得し、GPT-5.2を上回る性能を示し、AIの理解から実行への重要な進展を象徴。....

liko.aiが初のシリーズA資金調達を成功させ、エッジ側視覚言語モデルによりスマートホームを変革する！

スタートアップliko.aiが初回資金調達を完了。商湯国香資本、東方富海などが投資。調達資金はエッジ側視覚言語モデルとAIハードウェアの開発に充てられ、次世代家庭用コンピューティングハブの構築を目指す。AI Home CenterとAIカメラでスマートホーム体験を革新予定。....

全国初のクラウド宇宙星空モデルが発表されました。スマートシティ計画を支援します！

上海で全国初の都市計画AIモデル「雲宇星空」を発表。6000億パラメータでリモートセンシング画像や3Dデータを統合し、AI都市プランナーを目指す。業界基盤と6つの専門エージェントで構成され、都市計画・行政分野をカバー。....