剛剛,Cursor AI宣佈已集成Claude 3.7 Sonnet,並更新了用戶界面,使其更加簡潔易用。此外,Cursor還引入了跨聊天對話功能,能夠自動總結聊天摘要並繼承到新開的聊天窗口中,進一步提升了用戶體驗。
早些時候,Anthropic公司正式發佈其最新推理模型——Claude3.7Sonnet。這款模型以其創新的設計理念和顯著提升的編程能力,迅速成爲行業焦點。Claude3.7Sonnet的核心創新在於其將快速回答與深度思考能力融合於一體,模擬人類大腦的思維方式,爲用戶提供更流暢的交互體驗。
在實際應用中,用戶可以選擇標準模式,快速獲取答案,或切換至擴展思考模式,讓模型在回答前進行自我反思。這種模式特別適用於數學、物理和編程等複雜任務,能夠提供更準確和深入的解答。通過API,用戶還可以精確控制模型的思考預算,最高可達128K token,從而在速度、成本和答案質量之間找到最佳平衡點。與傳統模型不同,Claude3.7Sonnet更注重實際商業應用,而非單純競賽表現。
在編程領域,Claude3.7Sonnet的表現尤爲突出。在一項編程測試中,Sonnet以70.3%的高分領先於其他知名模型,如OpenAI的o1、o3-mini和DeepSeek R1,後者的得分僅在49%左右。這一結果表明,Anthropic有意將Sonnet定位爲一款強大的編碼AI,專注於提升編程能力,以滿足開發者在複雜代碼庫處理和全棧更新方面的需求。
Claude3.7Sonnet現已全面上線,支持免費版、專業版、團隊版和企業版,並可在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。不過,免費用戶目前無法使用擴展思考模式。在定價方面,Sonnet3.7與前代模型保持一致:每百萬輸入token收費3美元,每百萬輸出token收費15美元,包括思考token。
除了在編程能力上的提升,Claude3.7Sonnet在其他領域也展現了卓越的性能。例如,在TAU-bench測試中,Sonnet在零售場景中達到了81.2%的準確率,在航空場景中達到了58.4%,全面領先其他模型。此外,Sonnet還在指令理解、推理能力、多模態處理和代碼編寫等方面表現出色,尤其是在開啓擴展思考模式後,在數學和科學問題上的表現更是突飛猛進。