Anthropic宣佈重大突破,提出更好地理解神經網絡行爲的方法。研究成果將提高下一代人工智能的安全性和可靠性,有望幫助研究人員和開發者更好地控制AI模型的行爲。Anthropic通過深入研究神經網絡的特徵,解析了神經網絡內部的工作方式,爲預測神經網絡結果提供了新方法。這一突破或有助於克服理解語言模型行爲的挑戰,對人工智能領域具有重要意義。