月之暗面創始人楊植麟在2026年3月25日舉辦的中關村論壇年會上明確指出,大模型訓練正邁入由AI主導研究的第三個關鍵階段。 這一範式轉移標誌着大模型研發正從依賴天然數據與人工標註,向高度自動化的自我進化演進。

機器人 人工智能  AI


回顧技術路徑,楊植麟將大模型演進劃分爲三個時期:三年前的第一階段主要依賴互聯網天然數據及少量價值觀對齊的人工標註;去年的第二階段則側重於大規模強化學習,由研究員精選高質量任務以提升模型性能。進入2026年,AI研發方式發生根本性變革,研究員的角色正向“AI算力調度者”轉變。在這一新階段,研發過程將由AI利用大量Token自主合成新任務與環境,並定義最適宜的獎勵參數,甚至深度參與探索全新的網絡架構。

這一趨勢預示着AI研發效率將進入指數級加速期。月之暗面表示,其核心產品Kimi將致力於推動智能技術邊界,並與開源社區共同構建協同進化的技術生態。從“人教AI”到“AI導研”的轉變,不僅是訓練方法的升級,更是通用人工智能(AGI)實現路徑中從被動學習向自主探索跨越的重要里程碑。