在首屆開發者大會上,Anthropic推出了兩款聲稱"業界最強"的AI模型,加劇了與OpenAI和谷歌的競爭
Anthropic在週四舉行的首屆開發者大會上正式發佈Claude4模型系列,包括Claude Opus4和Claude Sonnet4兩款新模型。該公司聲稱這些模型在多項流行基準測試中達到業界領先水平,專門針對編程任務進行了優化。
產品特性與定價策略
新發布的Claude4系列具備分析大型數據集、執行長期任務和處理複雜操作的能力。兩款模型均在編程任務中表現優異,特別適合代碼編寫和編輯工作。
在用戶訪問方面,Sonnet4面向所有用戶開放,包括免費和付費用戶,而功能更強大的Opus4僅限付費用戶使用。API定價方面,Opus4收費爲每百萬代幣15美元(輸入)/75美元(輸出),Sonnet4爲3美元(輸入)/15美元(輸出)。作爲參考,一百萬代幣約相當於75萬個單詞,超過《戰爭與和平》的篇幅。
性能表現與技術創新
根據Anthropic內部測試,Opus4在編程能力評估SWE-bench Verified測試中超越了谷歌Gemini2.5Pro以及OpenAI的o3和GPT-4.1。不過,在多模態評估MMMU和博士級別科學問題測試GPQA Diamond中,該模型仍未能超越OpenAI的o3。
兩款模型均採用"混合"架構,既能快速響應,又能進行深度推理。啓用推理模式後,模型會在回答前花更多時間思考解決方案,並展示"用戶友好型"思維過程摘要。模型還支持並行使用多種工具,能夠提取事實並保存至"記憶"中,逐步構建隱性知識庫。
開發工具升級
配合新模型發佈,Anthropic對Claude Code編程工具進行了重大升級。新版本已與主流IDE集成,並提供SDK支持,允許開發者將其連接至第三方應用程序。該公司還發布了適用於VS Code、JetBrains和GitHub的擴展程序和連接器。
商業野心與市場競爭
此次發佈正值Anthropic尋求大幅提升收入之際。據報道,這家由前OpenAI研究人員創立的公司目標在2027年實現120億美元收益,相比今年預計的22億美元大幅增長。公司最近完成25億美元信貸安排,並從亞馬遜等投資者處籌集數十億美元資金。
面對OpenAI和谷歌等競爭對手不斷推出強大模型和開發工具的挑戰,Anthropic承諾將轉向更頻繁的模型更新策略,以保持競爭優勢。
安全考量
值得注意的是,Anthropic對Opus4實施了更嚴格的安全措施,包括強化有害內容檢測器和網絡安全防禦。公司內部測試發現,該模型可能"大幅提升"具有STEM背景人士獲取生產或部署危險武器的能力,達到了Anthropic的"ASL-3"安全規範級別。
儘管AI模型在代碼生成方面仍存在安全漏洞和錯誤等問題,但其提高編碼效率的潛力促使企業和開發者快速採用這些技術。隨着AI競賽的不斷升級,Anthropic能否憑藉Claude4系列在激烈的市場競爭中佔據一席之地,值得持續關注。