Anthropic於5月29日正式發佈了其最新旗艦大模型Claude Opus4.8。作爲一次針對用戶核心痛點的精準升級,新模型在保持原有價格體系的基礎上,全面強化了智能體編程、複雜邏輯推理以及多領域知識工作能力。

1.png

在覈心的AI編程和智能體表現上,新版模型帶來了顯著突破。多家早期測試機構的反饋表明,Opus4.8的日常表現更爲穩健,判斷也更加敏銳。在處理複雜的多步驟任務時,它不僅展現出了極高的可靠性,還能在計劃不合理時主動向用戶提出異議並標出不確定性。評估數據顯示,該模型放任自己所寫代碼出現缺陷卻不加說明的概率直接暴跌至前代的四分之一,這大幅減少了無依據結論的產生。

2.png

在業界備受矚目的基準測試中,新模型展現出了極強的統治力。官方數據顯示,Opus4.8在知名編程基準測試SWE-Bench Pro上取得了69.2%的優秀成績,並在多項核心主流基準測試中成功超越了GPT-5.5與Gemini3.1Pro,進一步鞏固了其在行業內的第一梯隊地位。

3.png

除了能力層面的躍升,本次升級在用戶體驗與計算成本上也帶來了巨大驚喜。全新的Claude平臺特別新增了“努力程度”控制功能,用戶可以在追求卓越質量與追求極致響應速度之間自由切換。更具顛覆性的是,新模型在快速模式下的運行速度直接飆升至此前的2.5倍,而實際消耗的模型成本卻大幅壓縮,僅爲先前模型的三分之一。這種加量還降本的升級策略,無疑將爲開發者提供更有力的生產力支持。