AI竟然學會了“睡覺”：Claude任務成功率暴漲 6 倍背後的祕密

在人工智能進化的道路上，Anthropic公司再次投下了一枚重磅炸彈。在近日舉辦的開發者大會上，Anthropic爲其旗下的智能體平臺Claude引入了一項名爲“Dreaming”（夢境）的突破性功能。這項技術的核心理念極具科幻色彩：讓AI在任務間隙進入一種類似人類“睡眠”的狀態，通過模擬快速眼動（REM）週期來整理和優化其記憶庫。

長期以來，AI代理在處理長週期、複雜任務時常面臨“記憶過載”的困擾。信息往往以碎片化形式堆積，隨着交流深入，重複、過時甚至相互矛盾的數據會導致AI運行效率下降。而“Dreaming”功能的出現，相當於爲AI提供了一個異步處理的“大腦後臺”。它能同時調取多達 100 個歷史會話的完整記錄，通過合併重複項、更新陳舊信息、提煉宏觀規律，將短期瑣碎的記憶轉化爲長期、高價值的知識庫。

嚴控風險：生成的記憶不直接覆蓋

爲了確保這一進化過程的安全性與可控性，Anthropic並未讓AI“盲目”更新。Dreaming生成的優化版記憶庫不會直接覆蓋原始數據，開發者擁有一票否決權，可以在審查優化結果後再決定是否應用。同時，平臺還配套推出了實時監控系統和自定義指令功能，讓開發者能夠像觀察實驗標本一樣，清晰地看到AI整理記憶的每一個步驟，並引導其聚焦於特定主題。

此外，爲了解決AI輸出質量波動的痛點，Outcomes自動評分系統也同步上線。該系統通過獨立的評估器對AI生成的成果進行精準打分，一旦發現缺陷，會立即指示AI重新優化，直到滿足預設標準。

實測表現驚人：任務成功率實現跨越式增長

技術的優劣最終要靠數據說話。內部測試結果顯示，Dreaming功能在多個應用場景中表現出色，文檔生成任務的成功率普遍提升了8%至10%。在法律科技領域，合作伙伴Harvey的實踐更是令人矚目：應用該技術組合後，其任務完成率竟然飆升了約 6 倍。

在更復雜的協作場景中，多智能體編排系統展現了強大的協同能力。通過將宏大任務拆解爲多個專業子任務並行處理，並在共享文件系統中彙總成果，系統的可靠性得到了質的飛躍。在月球採礦無人機着陸的模擬實驗中，這套系統將安全評分從不及格的67%直接拉昇至100%的完美標準。

算力加持：SpaceX超算中心提供後盾

如此高強度的記憶整理與模擬運算，背後離不開龐大算力的支撐。Anthropic宣佈已與SpaceX達成深度戰略合作，全量租賃了位於得克薩斯州的Colossus1 數據中心。憑藉 22 萬張高性能GPU的算力支持，Claude不僅能夠輕鬆應對“夢境”產生的數據洪流，也讓普通用戶獲得了實打實的福利：Claude Code使用限額翻倍，Pro/MAX版本的訪問限制大幅放寬，API調用速度也得到了顯著優化。

AI學會“睡眠”，或許正是其走向更高程度智能化的重要里程碑。

AI竟然學會了“睡覺”：Claude任務成功率暴漲 6 倍背後的祕密

嚴控風險：生成的記憶不直接覆蓋

實測表現驚人：任務成功率實現跨越式增長

算力加持：SpaceX超算中心提供後盾

相關推薦

OpenAI人才流動：前研究員田永龍入職騰訊，深耕視覺語言模型研發

Anthropic 搶先衝擊 IPO，AI 行業迎來千億營收新格局

馬斯克拋出Grok 4.5：自稱"Opus級"性能、價格僅十分之一，正面叫板OpenAI和Anthropic

瑞典“氛圍編碼”初創公司Lovable擬融資3億美元，估值或達132億美元

Steam玩家對AI沒那麼抗拒：43%表示可以接受，僅8%絕對不碰