在人工智能進化的道路上,Anthropic公司再次投下了一枚重磅炸彈。在近日舉辦的開發者大會上,Anthropic爲其旗下的智能體平臺Claude引入了一項名爲“Dreaming”(夢境)的突破性功能。這項技術的核心理念極具科幻色彩:讓AI在任務間隙進入一種類似人類“睡眠”的狀態,通過模擬快速眼動(REM)週期來整理和優化其記憶庫。
長期以來,AI代理在處理長週期、複雜任務時常面臨“記憶過載”的困擾。信息往往以碎片化形式堆積,隨着交流深入,重複、過時甚至相互矛盾的數據會導致AI運行效率下降。而“Dreaming”功能的出現,相當於爲AI提供了一個異步處理的“大腦後臺”。它能同時調取多達 100 個歷史會話的完整記錄,通過合併重複項、更新陳舊信息、提煉宏觀規律,將短期瑣碎的記憶轉化爲長期、高價值的知識庫。
嚴控風險:生成的記憶不直接覆蓋
爲了確保這一進化過程的安全性與可控性,Anthropic並未讓AI“盲目”更新。Dreaming生成的優化版記憶庫不會直接覆蓋原始數據,開發者擁有一票否決權,可以在審查優化結果後再決定是否應用。同時,平臺還配套推出了實時監控系統和自定義指令功能,讓開發者能夠像觀察實驗標本一樣,清晰地看到AI整理記憶的每一個步驟,並引導其聚焦於特定主題。
此外,爲了解決AI輸出質量波動的痛點,Outcomes自動評分系統也同步上線。該系統通過獨立的評估器對AI生成的成果進行精準打分,一旦發現缺陷,會立即指示AI重新優化,直到滿足預設標準。
實測表現驚人:任務成功率實現跨越式增長
技術的優劣最終要靠數據說話。內部測試結果顯示,Dreaming功能在多個應用場景中表現出色,文檔生成任務的成功率普遍提升了8%至10%。在法律科技領域,合作伙伴Harvey的實踐更是令人矚目:應用該技術組合後,其任務完成率竟然飆升了約 6 倍。
在更復雜的協作場景中,多智能體編排系統展現了強大的協同能力。通過將宏大任務拆解爲多個專業子任務並行處理,並在共享文件系統中彙總成果,系統的可靠性得到了質的飛躍。在月球採礦無人機着陸的模擬實驗中,這套系統將安全評分從不及格的67%直接拉昇至100%的完美標準。
算力加持:SpaceX超算中心提供後盾
如此高強度的記憶整理與模擬運算,背後離不開龐大算力的支撐。Anthropic宣佈已與SpaceX達成深度戰略合作,全量租賃了位於得克薩斯州的Colossus1 數據中心。憑藉 22 萬張高性能GPU的算力支持,Claude不僅能夠輕鬆應對“夢境”產生的數據洪流,也讓普通用戶獲得了實打實的福利:Claude Code使用限額翻倍,Pro/MAX版本的訪問限制大幅放寬,API調用速度也得到了顯著優化。
AI學會“睡眠”,或許正是其走向更高程度智能化的重要里程碑。
