原阿里通義千問(Qwen)大模型技術負責人林俊暘在離職數週後,於 3 月 26 日晚間首次公開發文,深度剖析了大模型技術的下一站演進。
林俊暘指出,行業正經歷從“推理式思維”向“智能體思維(Agentic Thinking)”的跨越。他認爲,過去一年行業糾結於如何讓模型“多想一會兒”,而未來的核心將在於模型能否爲了“採取行動”而思考,並在與現實世界的交互中持續修正計劃。
反思千問研發之路:強行合併“思考”與“指令”的陣痛
林俊暘在文中坦誠分享了千問團隊在 2025 年初的嘗試與教訓。當時團隊曾雄心勃勃地試圖構建一個統一系統,讓模型能根據問題難度自動調節推理力度。
然而實踐證明,推理數據與指令數據在分佈上的顯著差異,導致強行合併後的模型在兩個方向上都表現平庸:思考時顯得冗餘果斷不足,執行指令時又不夠可靠且成本高昂。這一洞察解釋了爲何 Qwen 隨後轉向了獨立發佈 Instruct 和 Thinking 版本的路線,也爲行業提供了寶貴的工程參考。
定義“好思考”的新標準:能撐起有效行動纔是關鍵
在林俊暘看來,推理鏈的長度並不直接等同於模型的聰明程度,盲目追求長邏輯鏈往往是在浪費算力。他預判,未來的研發重心將從單純的訓練模型,轉向訓練“模型+環境”的整個智能體系統。
在這種新範式下,評估模型好壞的標準將從“能否解出複雜的數學證明”轉變爲“能否在真實約束下通過持續交互取得進展”。這意味着,環境設計、多智能體協同以及評估器的穩健性,將正式進入 AI 研發的核心圈。
