この度、テンセントは混元大規模言語モデルシリーズの正式版——混元-T1を発表しました。この新しいモデルは混元の中規模基盤をベースに、大規模な事後学習を経て、推論能力が大幅に向上しました。特に、深層思考や複雑な問題解決において優れた性能を発揮します。今年2月に混元T1-Previewが公開されて以来、ユーザーはより速く、より深い思考プロセスを体験しており、今回の正式版のリリースは、このシリーズ製品の更なる進化を象徴するものです。

QQ_1742781079757.png

混元-T1の開発チームは、業界をリードする超大規模Hybrid-Transformer-Mamba MoEモデルである最新のTurboS基盤を採用しました。TurboSは長文推論において独自の強みを発揮し、コンテキストの欠落や長距離情報依存の問題を効果的に解決します。さらに、Mambaアーキテクチャも最適化されており、情報捕捉能力を維持しながら、計算資源の消費を大幅に削減できます。公式データによると、同じ配置条件下で、混元-T1のデコード速度は2倍向上しています。

QQ_1742781123687.png

事後学習段階では、チームは推論能力の向上と人間の好みへの最適化に重点を置き、96.7%の計算能力を強化学習訓練に投入しました。数学、論理的推論、科学、コードなど、幅広い分野の世界的な理科難問を収集し、モデルが様々な推論タスクで優れた性能を発揮できるようにしました。訓練にはコース学習方式を採用し、段階的にデータの難易度を高めています。

体験入口:https://llm.hunyuan.tencent.com/?ref=producthunt#/chat/hy-t1