Kimi楊植麟:大模型訓練進入AI主導研究的第三階段

月之暗面創始人楊植麟在2026年3月25日舉辦的中關村論壇年會上明確指出，大模型訓練正邁入由AI主導研究的第三個關鍵階段。這一範式轉移標誌着大模型研發正從依賴天然數據與人工標註，向高度自動化的自我進化演進。

機器人人工智能 AI

回顧技術路徑，楊植麟將大模型演進劃分爲三個時期:三年前的第一階段主要依賴互聯網天然數據及少量價值觀對齊的人工標註;去年的第二階段則側重於大規模強化學習，由研究員精選高質量任務以提升模型性能。進入2026年，AI研發方式發生根本性變革，研究員的角色正向“AI算力調度者”轉變。在這一新階段，研發過程將由AI利用大量Token自主合成新任務與環境，並定義最適宜的獎勵參數，甚至深度參與探索全新的網絡架構。

這一趨勢預示着AI研發效率將進入指數級加速期。月之暗面表示，其核心產品Kimi將致力於推動智能技術邊界，並與開源社區共同構建協同進化的技術生態。從“人教AI”到“AI導研”的轉變，不僅是訓練方法的升級，更是通用人工智能（AGI）實現路徑中從被動學習向自主探索跨越的重要里程碑。

螞蟻靈波全棧大腦2.0亮相WAIC，“鎮館之寶”智慧藥房驗證“一腦多機”

2026世界人工智能大會將於7月17日開幕，展覽最高榮譽十大“鎮館之寶”已揭曉併成焦點。入選項目包括螞蟻集團基於靈波跨本體具身大模型的機器人智慧藥房、中科曙光全國產十萬卡AI超集羣等，從技術含量、市場前景、可複製性和社會價值等維度綜合評選。

Kimi楊植麟:大模型訓練進入AI主導研究的第三階段

相關推薦

GPT-5. 6 智商首破 130 天才線，比99%人類都聰明，實測幹活能力同樣炸裂

OpenAI 開啓 AI 安全飛輪：GPT-Red 如何重新定義模型魯棒性

xAI罕見起訴Grok用戶：指控其濫用AI生成兒童性虐待圖片視頻，已封停超 5 萬個違規賬戶

螞蟻靈波全棧大腦2.0亮相WAIC，“鎮館之寶”智慧藥房驗證“一腦多機”

OpenAI發佈首款聯名硬件Codex Micro 鍵盤 230 美元還會發光

Kimi楊植麟:大模型訓練進入AI主導研究的第三階段

相關推薦

GPT-5. 6 智商首破 130 天才線，比99%人類都聰明，實測幹活能力同樣炸裂

OpenAI 開啓 AI 安全飛輪：GPT-Red 如何重新定義模型魯棒性

xAI罕見起訴Grok用戶：指控其濫用AI生成兒童性虐待圖片視頻，已封停超 5 萬個違規賬戶

螞蟻靈波全棧大腦2.0亮相WAIC，“鎮館之寶”智慧藥房驗證“一腦多機”

OpenAI發佈首款聯名硬件Codex Micro 鍵盤 ​230 美元還會發光

OpenAI發佈首款聯名硬件Codex Micro 鍵盤 230 美元還會發光