テンセントは正式に、混元(Hunyuan)モデルシリーズの新メンバーである「混元-A13Bモデル」をリリースし、オープンソース化しました。このモデルはエキスパート混合(MoE)アーキテクチャに基づいており、総パラメータ数は800億で、アクティブパラメータは130億です。トップクラスのオープンソースモデルの性能を維持しながら、推論遅延と計算コストを大幅に削減し、個人開発者や中小企業にとってよりコストパフォーマンスの高いAIソリューションを提供しています。

テンセントによると、混元-A13Bモデルは極端な条件下でも1枚の中低性能GPUカードで展開可能で、ユーザーはGitHubやHuggingFaceなどの技術コミュニティからダウンロードして利用できます。また、モデルのAPIもテンセントクラウド公式ウェブサイトでリリースされています。この特徴により、より多くの開発者が低いコストで最先端のAI技術にアクセスでき、イノベーションアプリケーションの実装を促進します。

微信截图_20250627155201.png

性能面では、混元-A13Bモデルは数学、科学、論理的推論のタスクにおいて優れた結果を示しています。例えば、数学的推論テストでは小数の比較を正確に行い、ステップバイステップの解析能力も備えています。さらに、このモデルはツールを使用して複雑な指示への応答を生成することができ、旅行のルート案内やデータファイルの分析などに対応し、スマートエージェント(Agent)アプリケーションの開発に大きな支援を提供しています。

技術面では、混元-A13Bモデルは予トレーニング中に20兆語の高品質なネットワークトークンデータセットを使用し、モデルの推論能力の上限を向上させ、MoEアーキテクチャのScaling Law理論体系を整備し、モデル設計に定量的な工学的指導を提供しています。同時に、ユーザーは必要に応じて思考モードを選択でき、高速思考モードでは簡潔かつ効率的な出力を提供し、遅速思考モードではより深い推論ステップが含まれるため、効率性と正確性の両方を考慮しています。

AIオープンソースエコシステムの発展をさらに推進するために、テンセントは2つの新しいデータセットもオープンソース化しました。そのうちの1つであるArtifactsBenchはコード評価に使用され、1825のタスクを含む新しいベンチマークを構築しています。もう1つはC3-Benchで、エージェントシナリオでのモデル評価を目的としており、1024件のテストデータが設計されており、モデルの能力の不足を見つけるために用いられます。

今回の混元-A13Bモデルのオープンソース化は、テンセントがAI分野で継続的に投資した成果の一つです。今後、テンセントの混元大モデルシリーズは、より多様なサイズや特徴を持つモデルを次々にリリースし、コミュニティと実践技術を共有し、オープンソースエコシステムの繁栄を共に促進していきます。

体験入口:https://hunyuan.tencent.com/

オープンソースアドレス:https://github.com/Tencent-Hunyuan