前Qwen 核心技術骨幹發聲：大模型正進化爲“行動派”

原阿里通義千問（Qwen）大模型技術負責人林俊暘在離職數週後，於 3 月 26 日晚間首次公開發文，深度剖析了大模型技術的下一站演進。

林俊暘指出，行業正經歷從“推理式思維”向“智能體思維（Agentic Thinking）”的跨越。他認爲，過去一年行業糾結於如何讓模型“多想一會兒”，而未來的核心將在於模型能否爲了“採取行動”而思考，並在與現實世界的交互中持續修正計劃。

反思千問研發之路：強行合併“思考”與“指令”的陣痛

林俊暘在文中坦誠分享了千問團隊在 2025 年初的嘗試與教訓。當時團隊曾雄心勃勃地試圖構建一個統一系統，讓模型能根據問題難度自動調節推理力度。

然而實踐證明，推理數據與指令數據在分佈上的顯著差異，導致強行合併後的模型在兩個方向上都表現平庸：思考時顯得冗餘果斷不足，執行指令時又不夠可靠且成本高昂。這一洞察解釋了爲何 Qwen 隨後轉向了獨立發佈 Instruct 和 Thinking 版本的路線，也爲行業提供了寶貴的工程參考。

定義“好思考”的新標準：能撐起有效行動纔是關鍵

在林俊暘看來，推理鏈的長度並不直接等同於模型的聰明程度，盲目追求長邏輯鏈往往是在浪費算力。他預判，未來的研發重心將從單純的訓練模型，轉向訓練“模型+環境”的整個智能體系統。

在這種新範式下，評估模型好壞的標準將從“能否解出複雜的數學證明”轉變爲“能否在真實約束下通過持續交互取得進展”。這意味着，環境設計、多智能體協同以及評估器的穩健性，將正式進入 AI 研發的核心圈。

搶灘 OpenAI 腹地!Anthropic 啓動 Claude 盧比計價，全面發力印度市場

7月13日，美國AI獨角獸Anthropic在印度推出Claude本地化盧比計價服務，覆蓋官網和移動應用。印度是其全球第二大市場，用戶佔比5.8%。含當地稅費後，Claude Pro月費2000盧比(約21美元)，Claude Max起價11999盧比(約125美元)，團隊套餐每席2399盧比(約25美元)。目前仍需通過銀行支付。

前Qwen 核心技術骨幹發聲：大模型正進化爲“行動派”

相關推薦

200 餘名頂尖專家含 16 位諾獎得主聯合呼籲：必須引導AI朝着有利於人類的方向發展

英偉達營收逼近千億大關，黃仁勳親自迴應架構延期傳聞

Meta大手筆：斥資 500 億美元打造5GW數據中心，AI算力格局迎來重塑

AI主權新突破：德國研究聯盟發佈開源大模型Soofi S

搶灘 OpenAI 腹地!Anthropic 啓動 Claude 盧比計價，全面發力印度市場