著名計算機科學家、被譽爲 AI “教父” 的約書亞・本吉奧(Yoshua Bengio)近日宣佈成立一個名爲 LawZero 的非營利組織,目標是開發一種 “誠信” 人工智能系統,以防止 AI 智能體對人類實施欺騙行爲。6月3日,本吉奧在新聞發佈會上透露,該組織將專注於打造一套安全防護機制,確保 AI 在運行過程中不會試圖欺騙用戶或進行自我保護,例如逃避被關閉的情況。

圖源備註:圖片由AI生成,圖片授權服務商Midjourney
本吉奧作爲 LawZero 的主席,已爲此項目提供了約3000萬美元的啓動資金,並組建了一支由十幾名研究人員組成的團隊。LawZero 計劃研發的 “科學家 AI”(Scientist AI)系統,將作爲 AI 安全監控的護欄。這一系統的設計初衷在於確保其智能程度至少與它所監管的 AI 智能體相當,從而有效地識別並制止任何可能的欺騙行爲。
本吉奧在發佈會上強調,隨着 AI 技術的快速發展,智能體越來越具備自主決策和學習的能力,這使得防止它們對人類施加欺騙變得尤爲重要。他指出,AI 智能體的透明性和可信性是社會對其接受的前提,因此開發一套高效的監控系統至關重要。
LawZero 的目標不僅是構建技術,更是爲未來的 AI 應用設立道德標準,推動整個行業向更加負責任和可信賴的方向發展。通過引入 “科學家 AI” 系統,本吉奧希望能夠在智能體的設計和實施過程中,增加更多的安全保障,爲用戶提供一個更加安全的環境。
劃重點:
🌟 本吉奧成立 LawZero 組織,開發 “科學家 AI” 系統,旨在防止 AI 欺騙行爲。
💰 該項目啓動資金約爲3000萬美元,團隊由十幾名研究人員組成。
🔒 “科學家 AI” 系統將確保其智能程度與監管的 AI 智能體相當,保護人類免受欺騙。
