2025年2月27日,騰訊正式發佈混元新一代快思考模型Turbo S,標誌着大模型技術在響應速度和性能優化方面取得了重要突破。與傳統的慢思考模型如Deepseek R1和混元T1不同,混元Turbo S能夠實現“秒回”,大幅提升輸出答案的速度,吐字速度提升一倍,首字時延降低44%。這一創新使得模型在知識、數理、創作等多個領域表現出色,爲大模型的快速響應能力提供了新的解決方案。
混元Turbo S的設計靈感來源於人類日常決策中90%~95%依賴直覺的快思考模式,與理性分析的慢思考模式相結合,爲大模型提供了更智能、高效的解決問題能力。通過長短思維鏈的融合,該模型不僅在文科問題上保持快速體驗,還顯著改進了理科推理能力,整體性能大幅提升。在業界通用的多個公開Benchmark測試中,混元Turbo S展現出與DeepSeek V3、GPT4o、Claude等領先模型相當的效果。

在架構創新方面,混元Turbo S採用了Hybrid-Mamba-Transformer融合模式,有效降低了傳統Transformer結構的計算複雜度和KV-Cache緩存佔用,顯著降低了訓練和推理成本。這一混合架構突破了傳統大模型在長文訓練和推理成本高的難題,發揮了Mamba架構處理長序列的優勢,同時保留了Transformer捕捉複雜上下文的能力,成爲工業界首次成功將Mamba架構無損應用於超大型MoE模型的案例。
作爲騰訊混元系列的核心基座,混元Turbo S未來將爲推理、長文、代碼等衍生模型提供基礎能力。基於Turbo S,騰訊還推出了具備深度思考能力的推理模型T1,該模型已在騰訊元寶全量上線,並將很快對外提供API接入服務。
目前,開發者和企業用戶已可在騰訊雲官網通過API調用混元Turbo S,並享受一週內免費試用的優惠。該模型的定價爲輸入0.8元/百萬tokens,輸出2元/百萬tokens,相比前代混元Turbo模型大幅降價。此外,混元Turbo S也即將在騰訊元寶中逐步灰度上線,用戶可在元寶內選擇“Hunyuan”模型並關閉深度思考功能進行體驗。
騰訊混元turbos模型API免費試用申請:https://cloud.tencent.com/apply/p/i2zophus2x8
