在北京舉辦的首屆開放日上,智象未來正式發佈了基於新一代原生全模態模型架構——Unified Transformer(UiT)打造的圖像大模型 HiDream-O1-Image-Pro。這款參數量超過 2 千億的原生全模態大模型,在多個權威基準測試中刷新了SOTA(最高水平)紀錄。同日,智象未來宣佈完成半個月內的第二輪融資,由深創投、金浦投資等多家頂級機構加持,再次印證了資本市場對“原生全模態”技術路徑的高度認可。
核心技術突破:從“模態拼接”到“原生統一”
當前視覺生成領域多采用“VAE+獨立語言模型編碼”的碎片化拼接範式,難以在複雜語義理解與細節還原上取得突破。智象未來通過 UiT 架構,將原始圖像像素、文本標記與任務條件納入統一的連續共享標記空間,實現了真正的“底層表徵融合”。
HiDream-O1-Image-Pro: 該模型爲閉源版本,參數規模超200B。它不僅具備頂級的文生圖能力,更在複雜文字渲染、指令編輯與多主體個性化生成等領域樹立了行業新標杆。
開源標杆: 其採用同源架構的8B參數版本此前已在全球評測平臺 Artificial Analysis 的文生圖榜單中登頂開源模型全球第一,且是前 20 名中參數量最小的版本,充分驗證了 UiT 架構卓越的可擴展性。
戰略重心:以“原生全模態”構建世界模型
智象未來創始人兼CEO梅濤指出,行業內所謂的“多模態”多爲“單模態拼接”,而智象未來追求的是“原生全模態”。他認爲,通過在模型架構初期就刻入“世界的規則”(空間關係、物理定律、因果邏輯),模型才能真正從“生成內容”進化爲“理解世界、推理世界、重構世界”,這是實現 AGI(通用人工智能)的必經之路。
業務落地:模型+智能體雙輪驅動
在深化底層架構的同時,智象未來構建了“1+1+3”業務架構,通過三大核心智能體應用驅動商業落地:
商業營銷智能體 (HiBurst): 已成爲 TikTok 官方 Top 5 服務商,年生產電商營銷視頻超百萬條,覆蓋 GMV 過億元。
AI 影視創作智能體 (“幀贊”): 實現了從創意到成片的全流程打通,已累計製作短漫劇超 5000 分鐘,吸引超千家專業團隊入駐。
社媒創作智能體 (vivago): 支持端到端長思考與分鐘級故事視頻生成,覆蓋全球 100 多個國家及地區的 4000 萬用戶。
生態共建:邁向 AGI 的產業路徑
在開放日現場,智象未來宣佈與上影新視野基金、藍色光標、捷成世紀及倍爾健康達成戰略合作,通過深度參與影視創作、跨境電商、醫療健康等賽道,加速模型能力向行業場景的轉化。
從視覺生成到構建世界模型,智象未來通過“Imaging the World”的願景,正致力於通過統一建模框架,讓 AI 具備理解不同模態下環境狀態及預測變化的能力。隨着多元化資本的持續注入與商業生態的快速擴張,智象未來正加速從視覺技術提供商向通用世界模型構建者的角色轉變。
