新研究顯示：Anthropic 的 Claude AI 在合作能力上領先於 OpenAI 和谷歌模型

近日，一項新的研究論文揭示了不同 AI 語言模型在合作能力方面的顯著差異。研究團隊採用了一種經典的 “捐贈者遊戲”，測試了 AI 代理在多代合作中如何共享資源。

結果顯示，Anthropic 的 Claude3.5Sonnet 表現出色，成功建立了穩定的合作模式，獲得了更高的資源總量。而谷歌的 Gemini1.5Flash 和 OpenAI 的 GPT-4o 則表現不佳，尤其是 GPT-4o 在測試中逐漸變得不合作，Gemini 代理的合作程度也十分有限。

合作併購收購

研究團隊進一步引入了懲罰機制，以觀察不同 AI 模型的表現變化。結果發現，Claude3.5的表現有了顯著提升，代理們逐漸發展出更爲複雜的合作策略，包括獎勵團隊合作和懲罰那些試圖利用系統卻不貢獻的個體。相對而言，當懲罰選項加入時，Gemini 的合作水平顯著下降。

研究者指出，這些發現可能對未來 AI 系統的實際應用產生重要影響，尤其是在 AI 系統需要相互合作的場景中。然而，研究也承認存在一些侷限性，例如測試只是在同一模型內部進行，而沒有混合不同模型。此外，研究中的遊戲設置較爲簡單，無法反映複雜的現實場景。此次研究沒有涵蓋最新發佈的 OpenAI 的 o1和谷歌的 Gemini2.0，這可能對未來 AI 代理的應用至關重要。

研究人員還強調，AI 的合作並不總是有益的，例如在可能的價格操控方面。因此，未來的關鍵挑戰在於開發能夠以人類利益爲重的 AI 系統，避免潛在的有害合謀行爲。

劃重點:
💡 研究表明，Anthropic 的 Claude3.5在 AI 合作能力上優於 OpenAI 的 GPT-4o 和谷歌的 Gemini1.5Flash。
🔍 引入懲罰機制後，Claude3.5的合作策略變得更加複雜，而 Gemini 的合作水平顯著下降。
🌐 研究指出，未來 AI 合作的挑戰在於如何確保其合作行爲能夠符合人類利益，避免潛在的負面影響。

GPT-4.5首度以“人格扮演”通過圖靈測試：AI對話能力邁向新高度

近日，一項由加州大學聖地亞哥分校認知科學系主導的研究爲人工智能領域帶來了里程碑式的突破:OpenAI最新模型GPT-4.5在標準圖靈測試中，以“人格扮演”方式首次實現了超越人類的表現，成爲目前最具類人對話能力的AI系統。這一成果不僅刷新了人們對AI語言能力的認知，也爲AI在社會智能領域的應用潛力打開了新的想象空間。此次實驗選取了四款具有代表性的AI系統進行對比測試，包括經典的1960年代聊天機器人ELIZA、Meta AI研發的LLaMa-3.1-405B，以及OpenAI的GPT-4o和GPT-4.5。研究人員設計了兩組

Anthropic安全防護面臨挑戰，AI模型通用越獄測試揭示突破口

在短短六天內，參與者成功繞過了Anthropic人工智能（AI）模型Claude3.5的所有安全防護措施，這一突破爲AI安全防護領域帶來了新的討論。前OpenAI對齊團隊成員、現就職於Anthropic的Jan Leike在X平臺宣佈，一名參與者成功攻破了所有八個安全級別。這項集體努力涉及了約3，700小時的測試和來自參與者的300，000條消息。儘管挑戰者成功突破，但Leike強調，目前還沒有人能夠提出一種通用的“越獄方法”來一次性解決所有安全挑戰。這意味着儘管存在突破，依然無法找到一種萬能的方式來繞過所有的

Anthropic 推出“體質分類器”：成功阻止95% 的模型越獄嘗試

人工智能公司 Anthropic 近日宣佈開發了一種名爲“體質分類器”的新安全方法，旨在保護語言模型免受惡意操縱。該技術專門針對“通用越獄”——一種試圖系統性繞過所有安全措施的輸入方式，以防止 AI 模型生成有害內容。爲了驗證這一技術的有效性，Anthropic 進行了一項大規模測試。公司招募了183名參與者，在兩個月內嘗試突破其防禦系統。參與者被要求通過輸入特定問題，試圖讓人工智能模型 Claude3.5回答十個禁止的問題。儘管提供了高達15，000美元的獎金和約3，000小時的測試時間，

你絕對想不到！重複這個簡單指令讓AI生成代碼快100倍

近期，BuzzFeed 的高級數據科學家麥克斯・伍爾夫進行了一項實驗，探索通過反覆請求 AI 改進代碼的效果。實驗中，他使用了 Claude3.5語言模型，給出了一個經典的編程挑戰:編寫 Python 代碼，以找出一百萬個隨機數中，數字之和爲30的最大值和最小值之間的差值。圖源備註：圖片由AI生成，圖片授權服務商Midjourney在初始版本中，Claude 生成的代碼運行時間爲657毫秒。然而，隨着伍爾夫不斷輸入 “寫出更好的代碼（write better code）” 這一簡單指令，最終生成的代碼運行時間縮短至僅6毫秒，提升了

Anthropic重磅升級Claude 3.5 系列模型，像人一樣操作電腦！

人工智能公司 Anthropic 宣佈Claude3.5系列模型的重磅升級，包括全新的 Claude3.5Sonnet 和 Claude3.5Haiku。升級後的版本號稱可以讓人工智能全面接管你的個人電腦，它能夠執行多種基本任務，比如模擬輸入鍵盤和鼠標點擊，從而使用你電腦上安裝的任何應用程序。編碼能力顯著提升，超越OpenAI o1-preview 模型新的 Claude3.5Sonnet 在各方面都有顯著提升，尤其是在編碼能力方面。它在 SWE-bench Verified 上的得分從33.4% 提升到49.0%，超越了所有公開可用的模型，包括 OpenAI 的 o1-preview 模型。此外，它在 TAU-bench