正文

崑崙萬維：多模態大模型已進入實驗性訓練階段

發布於AI新閒資訊

時間 :Aug 31, 2023

閱讀 :1分鐘

崑崙萬維表示其多模態大模型 “天工” 已進入實驗性訓練階段，經過持續的迭代和高負荷的運行。手機端天工 AI 助手已上線內測，用戶可進行萬字以上的文本對話交互。

英偉達推出統一音頻智能模型 Nemotron-Labs-Audex-30B-A3B

NVIDIA推出統一音頻-文本大模型Audex，基於純文本MoE架構，採用單一Transformer，解決多模態模型音頻增強導致文本邏輯下降的難題，實現高效音頻理解與文本能力的平衡。

谷歌DeepMind的文生視頻模型Gemini Omni Flash在權威盲測排行榜Video Arena中以1404Elo分躍居第一，彰顯谷歌多模態技術實力，也印證視頻生成領域正高速迭代。

崑崙萬維發佈天工3.2版，推出Skywork Tags功能，針對頻繁切換窗口搬運數據導致效率下降的痛點。其核心邏輯是不改變團隊既有協作流程，直接將AI智能體接入Slack、飛書、釘釘、Discord、Telegram等現有辦公羣組，讓智能體無縫融入工作場景。

商湯科技正祕密研發多模態大模型“U1Pro”，面向設計場景，由首席科學家林達華牽頭。該模型隸屬“日日新”家族，目標對標OpenAI的GPT-Image2，強調長程邏輯與思考能力，預計7月啓動內測並商用。

崑崙萬維發佈天工3.1，國內外同步上線，核心升級推出畫布設計Skywork Design與多Agent調度Dynamic Workflows，推動AI從演示轉向高完成度產品。天工3.0上線一個月後，其超級智能體依託高粘性Websites場景實現收入三倍增長，深度用戶單個項目平均交互輪數超40輪。

智啟未來，您的人工智能解決方案智庫