Anthropic今日宣佈推出Claude 3.5 Sonnet,這是Claude 3. 5 系列中的首款產品。該模型在多項評估中均優於競爭對手及其前身Claude 3 Opus,同時保持了與中端型號相當的速度和成本,樹立了行業新標準。
Claude 3.5 Sonnet現已在Claude.ai和Claude iOS應用上向公衆開放,同時通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI提供商業服務。該模型每百萬輸入令牌收費 3 美元,每百萬輸出令牌收費 15 美元,具有200K令牌的上下文窗口。

性能大幅提升
Claude 3.5 Sonnet在研究生水平推理、本科生水平知識和編碼能力等方面創下新的行業基準。它在理解細微差別、幽默感和複雜指令方面取得顯著進步,並能以自然親和的語氣創作高質量內容。
值得注意的是,Claude 3.5 Sonnet的運行速度是Claude 3 Opus的兩倍。在內部代理編碼評估中,Claude 3.5 Sonnet解決了64%的問題,遠超Claude 3 Opus的38%。這使得它特別適合處理複雜任務,如上下文相關的客戶支持和多步驟工作流程協調。

視覺能力顯著增強
Claude 3.5 Sonnet在視覺處理方面也取得重大突破,在標準視覺基準測試中超越了Claude 3 Opus。它在解釋圖表和圖形等需要視覺推理的任務中表現尤爲出色,還能準確地從不完美圖像中轉錄文本,這對零售、物流和金融服務等行業具有重要意義。

新功能:Artifacts
Anthropic同時在Claude.ai上推出了Artifacts功能,拓展了用戶與Claude的交互方式。用戶可以要求Claude生成代碼片段、文本文檔或網站設計等內容,這些內容會在專用窗口中與對話一起顯示,創造了一個動態工作空間。
安全與隱私承諾
儘管Claude 3.5 Sonnet的智能水平有了飛躍,Anthropic表示其仍保持在ASL- 2 安全水平。公司與外部專家合作,包括英國人工智能安全研究所(UK AISI),對模型進行了嚴格的安全測試。Anthropic強調,除非用戶明確允許,否則不會使用用戶提交的數據來訓練其生成模型。
未來展望
Anthropic計劃在今年晚些時候發佈Claude 3.5 Haiku和Claude 3.5 Opus,完善Claude 3. 5 系列。公司還在開發新的模式和功能,以支持更多企業用例,包括與企業應用程序集成和個性化記憶功能。
Anthropic邀請用戶在產品內直接提交反饋,以幫助改進Claude 3.5 Sonnet並指導未來的開發路線。
