大模型競爭格局再度洗牌。根據最新發佈的 Artificial Analysis 智能指數,Anthropic 的旗艦模型Claude Opus4.6憑藉卓越的表現力壓羣雄,正式登頂該權威排行榜。這一指數綜合了編程、代理任務和科學推理等十項深度測試,Opus4.6在代理類工作任務、終端編程以及物理研究課題上均斬獲第一

image.png

值得關注的是,儘管 Opus4.6的運行成本高達2,486美元,略高於 OpenAIGPT-5.2的2,304美元,但在效率表現上卻呈現出顯著差異。數據顯示,Opus4.6在測試過程中消耗了約5,800萬個輸出 Token,雖然這一數字是前代機型4.5的兩倍,但相較於 GPT-5.2驚人的1.3億個 Token,Opus4.6顯然在信息密度和處理邏輯上更爲精簡。目前,該模型已全面上線Claude.ai平臺,並支持通過 Google Vertex、AWS Bedrock 等主流雲服務進行調用。

然而,Anthropic 的領先地位正面臨嚴峻挑戰。行業巨頭 OpenAI 的新一代編程利器Codex5.3已在備測名單中。分析人士指出,一旦 Codex5.3完成所有基準測試,其在代碼編寫及相關邏輯領域的優勢極有可能助其重奪王座。這場“全球最聰明模型”的拉鋸戰,遠未到蓋棺論定的時候。