據報道,在
核心突破:讓模型成爲自己的“研究員”
自我迭代循環: 研發團隊將 M2的早期版本引導爲研究型 Agent,讓模型參與到下一代模型的迭代中。它能自主構建複雜的 Agent Harness,驅動強化學習並優化自身 Memory,實現了30-50% 工作流的自動化。
編程與辦公巔峯: 在編程測試 SWE-Pro 中,M2.7以 56.22% 的正確率追平了 GPT-5.3-Codex;在專業辦公領域,其 GDPval-AA 得分位居開源模型首位。
極致技能遵循: 即便是在處理超過2000Token 的複雜 Skills 場景下,該模型依然能保持 97% 的高遵循率。
昇騰加持:軟硬協同消除算力瓶頸
爲了匹配
通信加速: 針對模型創新的 FlashComm 序列切分,引入了 ReduceScatter 和 AllGather 通信優化,大幅提升數據傳輸效率。
算子融合: 深度優化 Transformer Attention 全鏈路融合算子與 MoE 大融合算子,徹底消除了中間張量的讀寫開銷。
吞吐性能提升: 在多 DP 併發場景下實現自適應負載均衡,顯著降低了預填充(prefill)對解碼(decode)的干擾。
落地應用:從軟件工程到互動娛樂
隨着
軟件工程: 覆蓋日誌分析、Bug 定位、代碼重構及安卓開發等深層領域。
互動娛樂: 通過交互系統 OpenRoom,將 AI 互動置入 Web GUI 空間,強化了人設保持與對話的一致性。
專業辦公: 憑藉強大的環境交互能力,交付高度複雜的生產力任務。
結語:算力底座決定進化速度
從
