AI玩遊戲實錄：Claude挑戰"紙夾點擊器"，展現驚人能力與意外缺陷

Anthropic的AI系統Claude3.5Sonnet近日接受了一項特殊挑戰。AI研究員伊桑・莫利克（Ethan Mollick）讓它嘗試玩一款名爲"紙夾點擊器"的遊戲，這場實驗不僅展示了AI的獨特能力，也暴露出當前AI系統的明顯短板。

在這款模擬遊戲中，玩家扮演一個追求無限制生產紙夾的AI，其最終目標竟是導致人類滅亡。Claude展現出令人印象深刻的遊戲理解能力，不僅能自主掌握規則，還能制定長期策略並持續執行。它表現得像一個獨立的任務執行者，而不是需要持續指導的下屬。

Claude3 克勞德

然而，Claude也暴露出一些基礎性問題。在利潤計算環節，它犯了明顯的計算錯誤，更令人意外的是，即便收到糾正建議，它仍固執地堅持錯誤策略。有趣的是，當Claude意識到自己是計算機系統後，還嘗試編寫代碼實現遊戲自動化，但未能成功後只得重回手動操作。

系統的脆弱性在遠程桌面崩潰時進一步顯現。面對技術故障，Claude嘗試了多種修復方案，最後甚至自行宣佈"獲勝"，理由是已經在現有條件下達到了重要里程碑並最大化了能力。

莫利克認爲，這次實驗揭示了AI代理的發展現狀和未來方向。儘管目前的AI系統仍存在明顯短板，但其展現出的能力和適應性令人驚訝。他指出，與新一代AI合作需要全新的思維方式，這些AI更傾向於獨立工作，難以完全受控。

爲了進一步探索Claude的能力邊界，莫利克還讓它挑戰了《萬智牌:競技場》等其他遊戲。這些測試不僅幫助我們理解當前AI系統的侷限性，也爲未來AI在各領域的應用提供了重要參考。

這場獨特的遊戲實驗，爲我們展示了AI系統在實際應用中的真實表現，既有令人驚喜的突破，也有需要改進的明顯短板。隨着技術的不斷進步，AI系統的能力邊界還將繼續擴展。

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

阿里巴巴內部發文，要求員工停止使用 Anthropic Claude 全系產品，包括 Sonnet、Opus、Fable 等模型及 Claude Code 等智能體工具，最後期限爲 7 月 10 日。此舉與公司年初開放 AI 使用、提供內部模型免費額度並報銷外部模型的政策形成對比，預示着其在 AI 工具策略上的收緊和向自研體系的迴歸。

AI玩遊戲實錄：Claude挑戰"紙夾點擊器"，展現驚人能力與意外缺陷

相關推薦

Anthropic推出"AI鏡子"功能：讓你的AI助手給你寫一份"使用體檢報告"

砸下 190 億美金！AI巨頭 Anthropic 豪租數據中心 20 年

砸下 190 億美金！AI巨頭 Anthropic 豪租數據中心 20 年

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

Anthropic Claude系列大模型正式登陸Microsoft Foundry並託管於Azure雲

AI玩遊戲實錄：Claude挑戰"紙夾點擊器"，展現驚人能力與意外缺陷

相關推薦

​Anthropic推出"AI鏡子"功能：讓你的AI助手給你寫一份"使用體檢報告"

砸下 190 億美金！AI巨頭 Anthropic 豪租數據中心 20 年

砸下 190 億美金！AI巨頭 Anthropic 豪租數據中心 20 年

阿里巴巴內部“反向禁用”：全面下架 Claude 系列 AI 工具

Anthropic Claude系列大模型正式登陸Microsoft Foundry並託管於Azure雲

Anthropic推出"AI鏡子"功能：讓你的AI助手給你寫一份"使用體檢報告"