元アリババ・ティアンイーワン(Qwen)の大規模モデル技術の責任者であるリン・ジュンヤン氏は、退職して数週間後に3月26日午後、初めて公開記事を発表し、大規模モデル技術の次の進化について深く分析した。

リン・ジュンヤン氏は、業界が「推論的思考」から「エージェント的思考(Agentic Thinking)」への移行に直面していると指摘した。彼は過去1年間、業界がモデルに「もっと考える時間」をもたらす方法に悩んできたが、今後の核心はモデルが「行動をとるため」に考えることができるか、そして現実世界との相互作用を通じて計画を継続的に修正できるかどうかにあると考えている。

ティアンイーワン開発の反省:「思考」と「指示」を強引に統合する痛み

リン・ジュンヤン氏は、2025年初頭のティアンイーワンチームの試みと教訓を率直に語った。当時、チームは問題の難易度に応じて推論の強度を自動調整できる統一システムの構築に意欲的だった。

しかし実際の検証では、推論データと指示データの分布の大きな違いにより、強引に統合されたモデルは両方の分野で平凡な性能となった。思考の際に冗長で果断性がなく、指示を実行する際には信頼性が低くコストがかかることが起きた。この洞察は、Qwenがその後インストラクション版とシンキング版を別々にリリースした理由を説明し、業界に貴重なエンジニアリングの参考を与えた。

「良い思考」の新しい基準:有効な行動を支えることこそが鍵

リン・ジュンヤン氏にとって、推論チェーンの長さがモデルの賢さを直接示すものではない。長い論理チェーンを無闇に求めることは計算資源の浪費である。彼は、将来的な研究開発の焦点が単なるモデルの訓練から、「モデル+環境」の全体的なエージェントシステムの訓練へと移るだろうと予測している。