生成式人工智能正在加速從“只會聊天”的問答工具,演變爲能夠捲起袖子幹活的“超級數字員工”。6月8日,雲知聲(9678.HK)正式發佈了新一代通用大語言模型——U2。作爲一款面向個人、開發者以及企業組織量身打造的原生智能體(Agent)大模型,U2徹底告別了傳統大模型重依賴單輪對話的侷限,將技術主線死死錨定在“高智能密度”與“高Token價值”的交付能力上。

在實際業務場景中,傳統模型往往只能處理短鏈路的文本生成,一旦面對龐雜的系統工程便無能爲力。而U2核心強化了面向真實任務的連續執行閉環。在複雜辦公、軟件工程、深度研究以及多工具協同等高難度場景下,它能夠像人類專家一樣,將一個宏觀的抽象任務自主拆解並連續推進超過100步的複雜工作流,實現了從“被動響應”到“主動執行”的跨越。

伴隨着新模型的發佈,一系列國內外權威能力評測的最新結果也同步出爐,U2在多個關鍵維度上直插主流大模型的第一梯隊。在極其考驗硬核知識與複雜邏輯推理能力的 GPQA Diamond 評測中,U2斬獲了87.9的高分,這一成績一舉超越了 GLM-5.1、Hy3preview、DeepSeek-V4-Flash(High)以及 MiniMax M2.7等衆多業內強勁對手,證明了其在面對高難度專業問題時擁有極強的穩定性。

除了死磕邏輯推理,U2在落地到日常白領工作時的交付質量同樣表現驚豔。在面向真實辦公與知識工作交付能力的 GDPval 評測中,該模型取得了72.5的優異成績。不同於常規的死記硬背式評測,GDPval 更側重於檢驗模型在企業生產環境中的實操產出。測試結果表明,U2已經能夠成熟地獨立搞定海量資料分析、專業報告撰寫、複雜表格處理、圖表動態生成以及高質感幻燈片製作等一系列典型的高價值辦公任務。隨着原生智能體大模型的常態化落地,AI 賦能產業的下半場正朝着更深的水域挺進。