騰訊正式發佈並開源混元大模型家族的新成員——混元-A13B模型。該模型採用基於專家混合(MoE)架構,總參數規模達800億,激活參數爲130億,在保持頂尖開源模型效果的同時,大幅降低了推理延遲與計算開銷,爲個人開發者和中小企業提供了更具性價比的AI解決方案。

據騰訊方面介紹,混元-A13B模型在極端條件下僅需1張中低端GPU卡即可部署,用戶可通過Github、HuggingFace等技術社區下載使用,模型API也已在騰訊雲官網上線。這一特性使得更多開發者能夠以較低成本接入前沿AI技術,推動創新應用落地。

微信截圖_20250627155201.png

在性能表現上,混元-A13B模型在數學、科學和邏輯推理任務中展現出領先效果。例如,在數學推理測試中,模型能夠準確完成小數比較並展現分步解析能力。此外,該模型還支持調用工具生成複雜指令響應,如出行攻略、數據文件分析等,爲智能體(Agent)應用開發提供了有力支持。

技術層面,混元-A13B模型通過預訓練中使用20萬億高質量網絡詞元語料庫,提升了模型推理能力的上限,並完善了MoE架構的Scaling Law理論體系,爲模型設計提供了可量化的工程化指導。同時,模型支持用戶按需選擇思考模式,快思考模式提供簡潔高效輸出,慢思考模式則涉及更深推理步驟,兼顧了效率與準確性。

爲進一步推動AI開源生態發展,騰訊還開源了兩個新數據集。其中,ArtifactsBench主要用於代碼評估,構建了包含1825個任務的新基準;C3-Bench則針對Agent場景模型評估,設計了1024條測試數據,以發現模型能力的不足。

此次混元-A13B模型的開源,是騰訊在AI領域持續投入的又一成果。未來,騰訊混元大模型家族還將推出更多尺寸、更多特色的模型,與社區共享實踐技術,共同促進開源生態的繁榮。

體驗入口:https://hunyuan.tencent.com/

開源地址:https://github.com/Tencent-Hunyuan