正文

重磅升級!Claude Opus4.1橫空出世，編程能力直衝74.5%新高!

發布於AI新閒資訊

時間 :Aug 6, 2025

閱讀 :1分鐘

今日，人工智能公司Anthropic正式發佈其旗艦模型Claude Opus4的升級版——Claude Opus4.1。此次更新旨在全面提升模型的agentic任務、真實世界編程和推理能力，尤其是在編程和數據分析方面的表現引人注目。

根據官方信息，Claude Opus4.1的最大亮點在於其驚人的編程性能提升。在SWE-bench Verified編程評測中，其表現高達74.5%，這一成績顯示了其在處理複雜代碼問題上的強大實力。GitHub的反饋也印證了這一點，開發者們普遍認爲Opus4.1在多文件代碼重構等任務上表現優於其前身。此外，日本電商巨頭Rakuten Group也指出，新模型能夠更精準地定位大型代碼庫中的錯誤，有效減少不必要的更改和潛在bug。

除了編程能力的飛躍，Opus4.1在深入研究和數據分析方面也有顯著進步，特別是在細節追蹤和agentic搜索能力上有所加強。Windsurf的基準測試結果顯示，Opus4.1的表現比Opus4提升了一個標準差，這一進步幅度堪比Sonnet3.7到Sonnet4的跨越。

儘管此次升級帶來了顯著的性能提升，但Anthropic強調，Opus4.1屬於漸進式改進，並非一次革命性的更新。它將繼續按照**AI安全等級3（ASL-3）**標準部署，並在多項安全評估中表現出穩健性。新模型在拒絕違規請求方面的表現略有提升，無害響應率達到了98.76%。

此外，在兒童安全、政治偏見以及代理性能力測試中，Opus4.1的風險水平與前一版本保持一致，並且在極端濫用場景的配合度上降低了約25%，顯示出更強的安全性。

Claude Opus4.1現已面向所有付費用戶、Claude Code、API、Amazon Bedrock和Google Cloud Vertex AI開放，價格維持與Opus4相同。

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

AI日報每日聚焦AI熱點，呈現創新產品，助開發者把握技術趨勢。本期報道：OpenAI升級Chrome擴展，ChatGPT可側邊欄常駐，支持閱讀網頁、操控標籤頁、讀寫本地文件及總結PDF，無需切換應用，僅限Plus與Pro用戶使用。

Jul 10, 2026

197.6k

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

Meta推出旗艦大模型Muse Spark 1.1，主打多代理自動化工作流，現已通過AI聊天服務及API開放公測。該模型由負責制定計劃的主代理和按指令執行任務的子代理構成，項目啓動時主代理自動生成執行方案。

Jul 10, 2026

195.8k

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

三星電子正加速佈局AI PC芯片，其自研加速處理器代號“GAIA”計劃2027年量產。該芯片由系統LSI事業部主導，基於4nm工藝，核心圍繞NPU設計，專注生成式AI任務加速。原型已送測聯想、惠普等廠商，進入性能驗證階段。

Jul 10, 2026

183.5k

吸金 20 億美元！MiniMax完成 160 億港元新一輪融資，獲超 7 倍超額認購

MiniMax完成160億港元（超20億美元）融資，將投入AI基礎設施、前沿模型研發與全球商業化擴張。本輪融資國際反響熱烈，最終規模超出原計劃的18億美元。

Jul 10, 2026

199.5k

摩根大通潑冷水：AI投資熱潮降溫，市場不再"沾AI就買"

摩根大通策略師戴維·萊博維茨指出，投資者對AI的態度正從盲目追捧轉向理性甄別。隨着AI成跨資產交易主題，華爾街必須學會分辨風險與回報。市場正細緻區分產業鏈各環節，判斷供給過剩與需求強勁的領域，告別單純狂熱。

Jul 10, 2026

177.9k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

重磅升級!Claude Opus4.1橫空出世，編程能力直衝74.5%新高!

相關推薦

AI日報：GPT5.6系列模型發佈 Codex消失;騰訊擬接盤Manus成最大股東；MiniMax創始人宣佈零薪酬直至實現AGI

​Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

三星殺回PC芯片戰場：自研AI專用芯片GAIA已送測聯想惠普， 2027 年量產

吸金 20 億美元！MiniMax完成 160 億港元新一輪融資，獲超 7 倍超額認購

​摩根大通潑冷水：AI投資熱潮降溫，市場不再"沾AI就買"

Meta 發佈新旗艦模型 Muse Spark 1.1，升級多代理自動化功能

摩根大通潑冷水：AI投資熱潮降溫，市場不再"沾AI就買"