5月21日,騰訊宣佈其混元大模型矩陣全面升級,標誌着騰訊在人工智能領域的技術能力持續提升。此次升級涵蓋了多個方面,包括旗艦快思考模型混元TurboS、深度思考模型混元T1的升級,以及基於TurboS基座新推出的視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice。此外,騰訊還同步更新了混元圖像2.0、混元3D v2.5及混元遊戲視覺生成等一系列多模態模型。

在全球公認的權威大語言模型評測平臺Chatbot Arena上,混元TurboS的排名已攀升至全球前八,國內僅次於DeepSeek。這一成就得益於預訓練階段的tokens增訓以及後訓練階段引入的長短思維鏈融合技術,使得TurboS在理科推理、代碼能力和競賽數學成績上均取得了顯著提升。年初發布的混元TurboS作爲業界首款大規模混合Mamba-MoE模型,在效果與性能上已展現出顯著優勢。

微信截圖_20250521134359.png

深度思考模型混元T1自年初上線後持續快速迭代,近期也迎來了新升級,在競賽數學、常識問答和複雜任務的Agent能力上均實現了提升。基於TurboS的基座模型,混元進一步拓展了圖片和音頻的多模態理解能力。新發布的混元視覺深度推理模型T1-Vision支持多圖輸入,具備原生長思維鏈,能夠輕鬆實現“邊看圖邊思考”,整體效果和理解速度相比此前的級聯方案都有顯著提升。端到端語音通話模型混元Voice實現了低延遲語音通話,響應速度提升超過30%,擬人性和情緒應用能力也有明顯提升,目前已在騰訊元寶App灰度上線。

在多模態生成領域,混元圖像2.0率先實現“毫秒級”生圖,GenEval基準測試準確率超95%,在主觀畫面質量和美學層面的人工測評中表現出色。混元3D v2.5憑藉業界首創的稀疏3D原生架構,實現了可控性與超高清生成能力的代際飛躍,幾何模型精度提升10倍,紋理貼圖達4K。在端到端評測中,混元文生3D和圖生3D均取得了優異成績。

在遊戲領域,混元推出了精通遊戲美術與術語的混元遊戲視覺生成模型,涵蓋遊戲技能特效生成、角色動態立繪、實時交互遊戲世界模型、角色多視圖等五大子模型。混元遊戲視覺生成平臺也正式上線,面向工業級遊戲資產生成,讓遊戲美術設計效率提升數十倍。近期,混元還將推出首個大規模、可漫遊3D場景生成模型,支持沉浸式交互、多樣風格場景生成及360°全景漫遊體驗,助力遊戲、具身智能等行業創新。

騰訊雲副總裁、騰訊混元大模型技術負責人王迪表示,混元正加速向智能化的深度與廣度邁進,爲AI普惠與產業升級提供堅實支撐。混元堅定擁抱開源,持續推進多尺寸、多場景的全系模型開源。目前,混元已實現圖像、視頻、3D、文本等在內的全模態開源,其中混元3D模型Hugging Face下載量超過160萬。未來,混元計劃推出多尺寸混合推理模型,適配企業與端側不同需求,並持續開源混元圖像、視頻、3D等多模態基礎模型及配套插件模型。