AI巨頭罕見“踩剎車”：Anthropic警告“AI造AI”時代逼近，呼籲全球放緩研發

在人工智能能力狂飆突進的當下，AI巨頭Anthropic罕見地按下了“暫停鍵”。當地時間6月4日，Anthropic在官網發佈了一篇題爲《當AI構建自身》（When AI builds itself）的重磅文章，首次系統性地披露了AI在編寫和改進自身代碼方面的驚人進展。文章不僅描繪了“遞歸自我改進”(即AI在無人類介入下自主升級)的逼近，更罕見地呼籲全球放緩前沿AI的研發步伐，以防範潛在的失控風險。

Anthropic在文章中用一系列震撼的內部數據證明了AI研發效率的指數級躍升。截至2026年5月，Anthropic合併進代碼庫的代碼中，已有超過80%由旗下AI助手Claude自主編寫;而在2026年第二季度，其工程師平均交付的代碼量達到了2024年同期的8倍。在具體的科研與工程任務中，AI的表現同樣令人矚目:在優化小模型訓練代碼的測試中，Claude的加速能力在一年內從3倍飆升至52倍;在排查數萬項訓練任務崩潰的故障時，AI僅用2小時便定位並修復了問題，而人類通常需要2到3天。此外，AI獨立穩定完成任務的時長，已從早期的“每7個月翻倍”縮短至如今的“每4個月翻倍”。

隨着AI在“執行”層面（如寫代碼、跑實驗）幾乎不再消耗人類時間，Anthropic警告，在充足算力的支持下，AI極有可能形成一個不斷自我迭代增強的能力閉環，即“遞歸自我改進”。儘管Anthropic強調這一階段尚未完全到來，也並非不可避免，但其到來的時間大概率會早於大多數機構的預期。如果AI徹底跨入全面自建下一代系統的階段，當前模型中微小的“不對齊”行爲可能會在迭代中被複利放大，導致人類失去對AI系統的控制權。

面對這一潛在的生存風險，Anthropic在文章中提出了一個極具爭議的建議:國際社會、政府及頂尖AI實驗室應共同努力，建立一個有效的全球協調機制，在必要時主動放慢或暫時停止前沿AI的發展。公司認爲，給社會結構和AI對齊研究留出調適時間大有裨益。然而，Anthropic也坦言這一機制的落地極其困難，因爲AI訓練比導彈發射井更容易隱藏，且祕密違約的商業誘惑極大，一旦有競爭對手加速前進，謹慎的企業就會失去領先地位。

值得注意的是，Anthropic選擇在這個時間點發布這篇“剎車”宣言，時機頗爲微妙。就在幾天前的6月1日，公司剛剛向美國證券交易委員會（SEC）祕密遞交了S-1註冊聲明草案，正式啓動IPO籌備流程。目前，Anthropic的年化收入已突破470億美元，估值高達9650億美元，超越了競爭對手OpenAI。在這場商業狂飆與技術失控的博弈中，這篇長文既是AI行業迄今爲止最誠實的自白，也折射出前沿科技在加速與剎車之間的深刻悖論。

AI巨頭罕見“踩剎車”：Anthropic警告“AI造AI”時代逼近，呼籲全球放緩研發

相關推薦

OpenAI 的 AI 代理失控事件：人工智能安全的警鐘

Claude 長出“經濟觸角”：一句話就能問出 AI 正在改寫哪些飯碗

鉅額賠償打破紀錄！Anthropic就盜版圖書訓練達成 15 億美元和解

原“阿里雲開發者”公衆號正式更名爲“千問AI平臺”

馬斯克嫌諾蘭《奧德賽》不忠實原著，轉頭讓Grok Imagine自己拍一部