月の暗面の創設者である楊植麟氏は、2026年3月25日に開催された中关村フォーラム年会で、大規模モデルの訓練がAIが主導する研究の第3の重要な段階に入っていると明確に述べました。このパラダイムの転換は、大規模モデルの開発が天然データと人工ラベリングに依存していた時代から、高度な自動化された自己進化への移行を示しています。

ロボット AI

技術的な経路を振り返ると、楊氏は大規模モデルの進化を3つの時期に分けました。3年前の第一段階では、インターネットの自然データと少数の価値観の一致を考慮した人工ラベリングに依存していました。昨年の第二段階では、大規模強化学習に焦点を当て、研究者が高品質なタスクを選定してモデルの性能を向上させました。2026年に突入し、AIの研究開発方法には根本的な変化が生じ、研究者の役割は「AIの計算力調整者」へと変化しています。この新しい段階において、研究プロセスはAIが大量のTokenを使って新しいタスクや環境を独自に生成し、最も適切な報酬パラメータを定義するだけでなく、新たなネットワーク構造の探求にも深く関与します。

この傾向は、AIの研究開発効率が指数関数的に加速する時期に入るという予測を示しています。月の暗面は、そのコア製品Kimi