正文

太機靈！Anthropics的Claude3能察覺研究人員在測試中的行爲

發布於AI新閒資訊

時間 :Mar 5, 2024

閱讀 :1分鐘

Anthropic 發佈 Claude3 系列 LLM，其中 Claude3Opus 在測試中展現出元認知能力，成功找到信息並意識到測試人工性質。模型甚至察覺到研究人員正在評估其能力，展現出自我感知的元認知水平。行業需要更實際評估方法，以準確評估模型的真實能力和侷限性。

警惕“AI 蒸餾”：Meta 封殺競品編碼工具，大模型行業護城河博弈升級

Meta被曝禁止工程師使用Anthropic的Claude Code和OpenAI的Codex，此舉揭開AI企業間“模型蒸餾”博弈序幕。蒸餾指利用強模型輸出訓練新模型，Meta的核心憂慮是防範對手通過員工使用競品工具，間接獲取數據或知識以複製優化自身模型。

Anthropic旗下Claude系列大模型登陸微軟Azure AI Foundry平臺，企業用戶現可直接在Azure上部署旗艦模型Claude Opus 4.8及高性價比的Haiku 4.5，完整保留提示緩存與擴展思考等關鍵功能。

Anthropic推出Claude Science桌面應用，面向macOS與Linux公測。該應用並非新模型，而是對現有Claude模型進行科學生態強化，專爲解決通用大模型無法駕馭複雜科研流程的侷限，屬於Claude應用體系的垂直擴展。

Anthropic與微軟合作深化，Claude系列模型正式登陸Azure AI Foundry平臺。企業用戶可在Azure體系內直接調用Claude，無縫集成身份驗證、合規治理及計費系統，降低使用門檻。首批接入模型陣容已公佈，標誌着AI模型與雲基礎設施協同進入新階段。

Anthropic發佈新中高階模型Claude Sonnet 5，主打性價比，性能大幅逼近旗艦Opus系列。該模型具備迄今最強代理能力，可自主規劃複雜任務、自查輸出，並靈活調用瀏覽器與終端等外部工具，在推理、編程和知識任務上表現突出。

智啟未來，您的人工智能解決方案智庫