近日,騰訊正式推出了其自研的深度思考模型——混元T1正式版。

混元T1正式版在大規模強化學習的基礎上,針對數學、邏輯推理、科學和代碼等理科難題進行了專項優化,從而實現了推理能力的顯著提升。在常見benchmark上,如大語言模型評估增強數據集MMLU-PRO中,混元T1取得了87.2分的優異成績,僅次於頂尖模型o1。同時,在CEval、AIME、Zebra Logic等中英文知識及競賽級數學、邏輯推理的公開基準測試中,混元T1也展現出了業界領先推理模型的水平。

騰訊最強!混元自研深度思考模型T1 正式發佈:吐字快、能秒回

除了基礎推理能力外,混元T1正式版還在多項對齊任務、指令跟隨任務和工具利用任務中展現出了非常強的適應性。這得益於其沿用了混元Turbo S的創新架構,並採用了Hybrid-Mamba-Transformer融合模式。這是工業界首次將混合Mamba架構無損應用於超大型推理模型,有效降低了傳統Transformer結構的計算複雜度,減少了KV-Cache的內存佔用,從而顯著降低了訓練和推理成本。

此外,基於出色的長文捕捉能力,混元T1能有效解決長文推理中常見的上下文丟失和長距離信息依賴問題。混合Mamba架構針對長序列處理進行了專項優化,通過高效的計算方式,在確保長文本信息捕捉能力的同時大幅降低資源消耗。在相近的激活參數量下,混元T1實現瞭解碼速度提升2倍。

目前,騰訊混元T1已經開放體驗,並上線了API服務。用戶可以根據需求,以每百萬tokens1元的輸入價格和每百萬tokens4元的輸出價格,享受這一強大推理模型帶來的便捷與高效。