隨着 Anthropic 正式發佈 Opus 4.6 模型,一場關於 AI 自主編程能力的硬核實驗引發了科技圈的熱議。Anthropic 安全團隊研究員 Nicholas Carlini 近日透露,他利用 16 個 Claude 智能體(Agents)組建了一個“特工團隊”,在幾乎沒有人工干預的情況下,從零開始編寫出了一個基於 Rust 語言的 C 編譯器。

這場實驗堪稱“昂貴”。在爲期兩週的開發週期內,這些 AI 智能體經歷了近 2000 次代碼會話,消耗了約 20 億個輸入 Token,最終產生的 API 費用高達 2 萬美元(約合 14.4 萬人民幣)。然而,投入換來了驚人的產出:這支 AI 團隊自主生成了超過 10 萬行代碼,且該編譯器成功實現了在 x86、ARM 和 RISC-V 架構上編譯 Linux 6.9 內核。

儘管成果斐然,Carlini 卻表達了“興奮與不安並存”的複雜心情。他發現,雖然 AI 可以通過循環指令實現 24 小時無間斷工作,自主解決“下一個最顯而易見”的問題,但其生成的代碼質量仍不及頂尖人類程序員,且在缺乏引導時容易陷入無效測試的死循環。更有觀察者在 GitHub 上調侃,這種從海量訓練數據中“拼湊”出的代碼並非真正意義上的從零創作。這場實驗不僅展示了智能體團隊協作處理複雜項目的潛力,也讓開發者們開始審視軟件自動化生產背後的安全與驗證風險。