商湯科技於 28日正式發佈並開源日日新 SenseNova U1系列原生理解生成統一模型。該模型基於商湯今年3月自主研發的 NEO-unify 架構,在單一模型框架下實現了多模態理解、推理與生成的深度統一,標誌着多模態 AI 範式從“集成式”向“原生統一”的重大跨越。

SenseNova U1所採用的 NEO-unify 架構徹底摒棄了主流模型中常見的拼接式設計,通過去除視覺編碼器(VE)與變分自編碼器(VAE),重構了統一的表徵空間。這種架構將多模態處理深入融入每一層計算,使語言與視覺信息能夠作爲統一複合體直接建模,在保留語義豐富度的同時維持了像素級的視覺保真度。依託該技術,模型在邏輯推理與空間智能領域表現顯著,能夠精準理解物理世界的複雜佈局與精細關係。

隨着具身智能趨勢的演進,商湯科技計劃未來將該模型作爲機器人的“具身大腦”,在單一模型閉環內完成從環境感知到邏輯推演、再到任務執行的全過程。此次開源行動不僅爲行業提供了關鍵的底層技術引擎,也預示着 AI 模型正向着更高集成度與更強泛化能力的通用架構加速演進。