騰訊自研大模型混元2.0(Tencent HY2.0)正式發佈,與此同時,DeepSeek V3.2也逐步接入騰訊生態。目前,這兩大模型已在元寶、ima等騰訊AI原生應用中率先上線,騰訊雲也同步開放了相關模型的API及平臺服務。
全新發布的Tencent HY2.0採用混合專家(MoE)架構,總參數量高達406B(激活參數32B),支持256K超長上下文窗口,其推理能力和效率在業界處於領先地位。

與上一版本(Hunyuan-T1-20250822)模型相比,HY2.0Think在預訓練數據和強化學習策略上有了顯著改進。在數學、科學、代碼、指令遵循等複雜推理場景中,其綜合表現穩居國內第一梯隊,泛化性也大幅提升。
在數學科學知識推理方面,HY2.0Think使用高質量數據進行Large Rollout強化學習,推理能力大幅增強。在國際數學奧林匹克競賽(IMO-AnswerBench)和哈佛MIT數學競賽(HMMT2025)等權威測試中,該模型取得了一流成績。結合預訓練數據的進步,模型在極度考驗知識水平的Humanitys Last Exam(HLE)和泛化性的ARC AGI等任務上也有大幅進步。

在指令遵循與長文多輪能力上,HY2.0Think通過重要性採樣修正緩解了訓練和推理不一致問題,實現了長窗口RL的高效穩定訓練。同時,藉助多樣化可驗證的任務沙盒以及基於打分準則的強化學習,該模型在Multi Challenge等指令遵循和多輪任務上的效果顯著提升。
代碼與智能體能力方面,騰訊構建了規模化的可驗證環境及高質量合成數據,極大增強了模型在Agentic Coding及複雜工具調用場景下的落地能力。在SWE-bench Verified及Tau2-Bench等面向真實應用場景的智能體任務上,該模型實現了躍升。
