
技術層面,Ring-2.6-1T 實現了三大核心突破:首先是 Agent 執行能力的全面增強,在 PinchBench 與 ClawEval 等評估 Agent 適配能力的基準測試中達到開源 SOTA 水平,顯著優化了任務拆解與反饋修正能力;
其次,創新性引入“Reasoning Effort”可調節機制,支持 high 與 xhigh 雙檔位推理強度,使開發者能根據任務複雜度平衡成本與性能,其中 high 檔在 Tau2-Bench 電信業務測試中表現優異,而 xhigh 檔在 AIME26及 GPQA Diamond 等高難推理任務中觸達能力上限;
最後,模型採用異步(Async)強化學習架構結合“棒冰算法”,有效解決了萬億級模型長週期訓練的穩定性難題,大幅提升了資源利用率。
目前,Ring-2.6-1T 已在
