Anthropic更新安全政策，設置 “安全門檻”以避免AI失控

在人工智能技術飛速發展的當下，Anthropic 公司近日宣佈更新其 “責任擴展政策（RSP）”，這一政策旨在有效管理高能力 AI 系統所帶來的潛在風險。作爲開發熱門聊天機器人 Claude 的公司，Anthropic 此舉顯然是想在不斷增強的 AI 能力與必要的安全標準之間找到平衡。

Anthropic、克勞德

這項新政策引入了所謂的能力閾值，作爲 AI 模型能力提升時，額外安全保障的明確標誌。這些閾值涵蓋了諸如生物武器製造和自主 AI 研究等高風險領域，顯示出 Anthropic 致力於防止其技術被惡意利用的決心。值得一提的是，政策中還設立了 “責任擴展官” 這一角色，專門負責監督合規性並確保相應的安全措施到位。

隨着 AI 能力的加速提升，行業內對風險管理的重視也在加大。Anthropic 明確表示，其能力閾值和相應的必要保障，旨在防止 AI 模型在被惡意使用或意外情況下造成大規模傷害。政策重點關注化學、生物、放射和核武器（CBRN）及自主 AI 研發領域，這些都是未來 AI 可能被不法分子利用的風險點。

此外，Anthropic 希望這一政策不僅能爲自己提供內部治理框架，還能爲整個 AI 行業樹立標準。他們的 AI 安全等級（ASL）系統，類似於美國政府的生物安全標準，將有助於 AI 開發者在風險管理上建立系統化的方法。

新的政策還進一步明確了責任擴展官的職責，確保公司在 AI 安全協議的執行上有更嚴格的監督機制。如果發現某個模型的能力達到高風險閾值，責任擴展官有權暫停其訓練或部署。這種自我監管的機制，可能會爲其他致力於前沿 AI 系統的公司提供榜樣。

隨着全球範圍內對 AI 技術監管的不斷加強，Anthropic 的這項更新顯得尤爲及時。通過引入能力報告和安全評估的公開披露，Anthropic 希望能在行業中樹立透明度的榜樣，爲未來 AI 的安全管理提供清晰的框架。

劃重點:
🌟 Anthropic 更新 “責任擴展政策”，引入能力閾值以加強 AI 風險管理。
🛡️ 新政策設立 “責任擴展官” 角色，監督 AI 安全協議的執行與合規。
🚀 該政策旨在爲 AI 行業樹立安全標準，促進透明度和自我監管。

Claude AI 模型正式上線 Microsoft Foundry 與 365 Copilot

Anthropic與微軟深化合作，三款Claude模型（Sonnet4.5、Haiku4.5、Opus4.1）正式登陸Microsoft Foundry平臺並開放公測。Azure客戶現可通過該平臺調用先進AI模型開發企業級應用與智能代理，充分融合微軟生態優勢。核心價值在於企業能在熟悉的微軟環境中便捷部署Claude系列模型。

英偉達微軟聯手押注AI：150億美元投資Anthropic

英偉達與微軟將向AI初創公司Anthropic投資高達150億美元，其中英偉達承諾最多100億美元，微軟最多50億美元。Anthropic是ChatGPT競爭對手Claude的開發商。此次投資正值AI領域熱潮持續，但華爾街已開始擔憂AI泡沫風險。微軟目前持有Anthropic競爭對手OpenAI 27%的股份。

Anthropic更新安全政策，設置 “安全門檻”以避免AI失控

相關推薦

反常現象：嚴格反黑客提示反而促使 AI 模型產生欺騙與破壞行爲

反直覺發現:禁止 AI 作弊反而更危險?Anthropic 揭示獎勵機制操控的新風險

Claude AI 模型正式上線 Microsoft Foundry 與 365 Copilot

微軟Win11測試“AI文件連接器”：Claude可直接請求本地文件

英偉達微軟聯手押注AI：150億美元投資Anthropic

Anthropic更新安全政策，設置 “安全門檻”以避免AI失控

相關推薦

反常現象：嚴格反黑客提示反而促使 AI 模型產生欺騙與破壞行爲

​反直覺發現:禁止 AI 作弊反而更危險?Anthropic 揭示獎勵機制操控的新風險

​Claude AI 模型正式上線 Microsoft Foundry 與 365 Copilot

微軟Win11測試“AI文件連接器”：Claude可直接請求本地文件

英偉達微軟聯手押注AI：150億美元投資Anthropic

反直覺發現:禁止 AI 作弊反而更危險?Anthropic 揭示獎勵機制操控的新風險

Claude AI 模型正式上線 Microsoft Foundry 與 365 Copilot