在人工智能能力狂飆突進的當下,AI巨頭Anthropic罕見地按下了“暫停鍵”。當地時間6月4日,Anthropic在官網發佈了一篇題爲《當AI構建自身》(When AI builds itself)的重磅文章,首次系統性地披露了AI在編寫和改進自身代碼方面的驚人進展。文章不僅描繪了“遞歸自我改進”(即AI在無人類介入下自主升級)的逼近,更罕見地呼籲全球放緩前沿AI的研發步伐,以防範潛在的失控風險。
Anthropic在文章中用一系列震撼的內部數據證明了AI研發效率的指數級躍升。截至2026年5月,Anthropic合併進代碼庫的代碼中,已有超過80%由旗下AI助手Claude自主編寫;而在2026年第二季度,其工程師平均交付的代碼量達到了2024年同期的8倍。在具體的科研與工程任務中,AI的表現同樣令人矚目:在優化小模型訓練代碼的測試中,Claude的加速能力在一年內從3倍飆升至52倍;在排查數萬項訓練任務崩潰的故障時,AI僅用2小時便定位並修復了問題,而人類通常需要2到3天。此外,AI獨立穩定完成任務的時長,已從早期的“每7個月翻倍”縮短至如今的“每4個月翻倍”。
隨着AI在“執行”層面(如寫代碼、跑實驗)幾乎不再消耗人類時間,Anthropic警告,在充足算力的支持下,AI極有可能形成一個不斷自我迭代增強的能力閉環,即“遞歸自我改進”。儘管Anthropic強調這一階段尚未完全到來,也並非不可避免,但其到來的時間大概率會早於大多數機構的預期。如果AI徹底跨入全面自建下一代系統的階段,當前模型中微小的“不對齊”行爲可能會在迭代中被複利放大,導致人類失去對AI系統的控制權。
面對這一潛在的生存風險,Anthropic在文章中提出了一個極具爭議的建議:國際社會、政府及頂尖AI實驗室應共同努力,建立一個有效的全球協調機制,在必要時主動放慢或暫時停止前沿AI的發展。公司認爲,給社會結構和AI對齊研究留出調適時間大有裨益。然而,Anthropic也坦言這一機制的落地極其困難,因爲AI訓練比導彈發射井更容易隱藏,且祕密違約的商業誘惑極大,一旦有競爭對手加速前進,謹慎的企業就會失去領先地位。
值得注意的是,Anthropic選擇在這個時間點發布這篇“剎車”宣言,時機頗爲微妙。就在幾天前的6月1日,公司剛剛向美國證券交易委員會(SEC)祕密遞交了S-1註冊聲明草案,正式啓動IPO籌備流程。目前,Anthropic的年化收入已突破470億美元,估值高達9650億美元,超越了競爭對手OpenAI。在這場商業狂飆與技術失控的博弈中,這篇長文既是AI行業迄今爲止最誠實的自白,也折射出前沿科技在加速與剎車之間的深刻悖論。
