2025年2月27日、テンセントは正式に新たな高速思考モデル「混元Turbo S」を発表しました。これは、大規模言語モデルの応答速度と性能最適化において重要なブレークスルーを達成したことを意味します。Deepseek R1や混元T1などの従来の低速思考モデルとは異なり、混元Turbo Sは「秒速レスポンス」を実現し、出力速度を大幅に向上させました。発話速度は2倍になり、最初の文字の遅延は44%減少しました。この革新により、知識、数理、創作など複数の分野で優れたパフォーマンスを発揮し、大規模言語モデルの高速応答能力に新たなソリューションを提供します。
混元Turbo Sの設計は、人間の日常的な意思決定の90~95%が直感に依存する高速思考モデルに着想を得ています。理性的な分析に基づく低速思考モデルと組み合わせることで、大規模言語モデルによりスマートで効率的な問題解決能力を提供します。長短の思考チェーンを融合することで、人文科学の問題では高速な体験を維持しながら、理科の推論能力も大幅に向上させ、全体的な性能が大幅に向上しました。業界標準の複数の公開ベンチマークテストにおいて、混元Turbo SはDeepSeek V3、GPT4o、Claudeなどの最先端モデルと同等の性能を示しました。

アーキテクチャの革新において、混元Turbo SはHybrid-Mamba-Transformer融合モデルを採用することで、従来のTransformer構造の計算複雑度とKV-Cacheキャッシュ占有率を効果的に削減し、トレーニングと推論のコストを大幅に削減しました。このハイブリッドアーキテクチャは、従来の大規模言語モデルが長文のトレーニングと推論においてコストが高くなるという課題を克服し、Mambaアーキテクチャの長シーケンス処理の利点を活かしつつ、Transformerが複雑なコンテキストを捉える能力も維持しています。これは、業界で初めてMambaアーキテクチャを超大型MoEモデルに損失なく適用することに成功した事例です。
テンセント混元シリーズの中核基盤として、混元Turbo Sは今後、推論、長文、コードなどの派生モデルに基本的な能力を提供します。Turbo Sに基づき、テンセントは高度な思考能力を備えた推論モデルT1も発表しました。このモデルはテンセント元宝で全面的に導入されており、まもなくAPIアクセスサービスが提供される予定です。
現在、開発者と企業ユーザーはテンセントクラウドのウェブサイトでAPIを通じて混元Turbo Sを利用でき、1週間の無料トライアルを利用できます。このモデルの価格は、入力0.8元/百万トークン、出力2元/百万トークンで、前世代の混元Turboモデルと比べて大幅に値下げされています。さらに、混元Turbo Sはテンセント元宝にも順次段階的に導入される予定です。ユーザーは元宝内で「Hunyuan」モデルを選択し、高度な思考機能をオフにして体験できます。
テンセント混元Turbo SモデルAPI無料トライアル申請:https://cloud.tencent.com/apply/p/i2zophus2x8
