正文

AI 教父本吉奧宣佈創建 “科學家 AI” 系統，致力於防範智能體欺騙

發布於AI新閒資訊

時間 :Jun 4, 2025

閱讀 :1分鐘

著名計算機科學家、被譽爲 AI “教父” 的約書亞・本吉奧（Yoshua Bengio）近日宣佈成立一個名爲 LawZero 的非營利組織，目標是開發一種 “誠信” 人工智能系統，以防止 AI 智能體對人類實施欺騙行爲。6月3日，本吉奧在新聞發佈會上透露，該組織將專注於打造一套安全防護機制，確保 AI 在運行過程中不會試圖欺騙用戶或進行自我保護，例如逃避被關閉的情況。

AI，人工智能

圖源備註：圖片由AI生成，圖片授權服務商Midjourney

本吉奧作爲 LawZero 的主席，已爲此項目提供了約3000萬美元的啓動資金，並組建了一支由十幾名研究人員組成的團隊。LawZero 計劃研發的 “科學家 AI”（Scientist AI）系統，將作爲 AI 安全監控的護欄。這一系統的設計初衷在於確保其智能程度至少與它所監管的 AI 智能體相當，從而有效地識別並制止任何可能的欺騙行爲。

本吉奧在發佈會上強調，隨着 AI 技術的快速發展，智能體越來越具備自主決策和學習的能力，這使得防止它們對人類施加欺騙變得尤爲重要。他指出，AI 智能體的透明性和可信性是社會對其接受的前提，因此開發一套高效的監控系統至關重要。

LawZero 的目標不僅是構建技術，更是爲未來的 AI 應用設立道德標準，推動整個行業向更加負責任和可信賴的方向發展。通過引入 “科學家 AI” 系統，本吉奧希望能夠在智能體的設計和實施過程中，增加更多的安全保障，爲用戶提供一個更加安全的環境。

劃重點:
🌟 本吉奧成立 LawZero 組織，開發 “科學家 AI” 系統，旨在防止 AI 欺騙行爲。
💰 該項目啓動資金約爲3000萬美元，團隊由十幾名研究人員組成。
🔒 “科學家 AI” 系統將確保其智能程度與監管的 AI 智能體相當，保護人類免受欺騙。

打破專用模型桎梏！谷歌 DeepMind 發佈 GenCeption，一個 AI 搞定五大視覺任務

谷歌DeepMind推出GenCeption模型，將視頻生成AI逆向改造爲視覺分析引擎，單一模型即可同時完成深度估計、圖像分割、3D姿態估計等五項核心視覺任務。模型基於阿里通義萬相Wan2.1框架訓練，一次前向傳播實現預測，打破任務孤立格局。

Jul 21, 2026

134.9k

消息稱智元機器人據悉衝刺IPO，目標估值200億美元

智元機器人以約200億美元估值推進IPO，中信證券任輔導券商，預計2026年營收40億元。在2026 WAIC上，公司發佈五款機器人新品，包括遠征A3Ultra、精靈G2Max、靈犀X2EDU、臨界點靈巧手及酷拓騎行機器人，體現“三智一體”架構。

Jul 21, 2026

133.1k

美國大模型抄了DeepSeek作業：性能沒贏、價格更貴，卻精準卡住了美國企業的合規剛需

OpenAI前CTO穆拉蒂的初創公司發佈首款模型Inkling，其架構與數據大量借鑑DeepSeek和月之暗面等中國模型，卻在評測中表現落後且價格更高。這家中美角色“互換”的公司估值竟高達120億美元，反差巨大。

Jul 21, 2026

159.2k

日本Sakana AI放出Fugu Cyber：一個多智能體系統，把GPT-5.5-Cyber和Claude都挑落馬下

7月21日，日本AI初創Sakana AI發佈Fugu Cyber網絡防禦模型，在CyberGym和CTI-REALM基準測試中分別取得86.9%和72.1%成功率，力壓GPT-5.5-Cyber等頂尖閉源模型，重新定義網絡安全防線。

Jul 21, 2026

131.2k

Anthropic Fable 5 訓練成本三倍於開源模型，未來面臨挑戰

Wojciech Gryc 分析指出，Anthropic 的 Fable 5 面臨來自中國開源模型的市場競爭：Moonshot 的 Kimi K3 和阿里 Qwen 3.8 性能與之相當，且都將開源權重。他強調，雖然訓練前沿模型的主要成本是研究人員與算力，但模型訓練完成後，推理成本纔是真正的開支；每次調用 API 消耗大量 GPU 資源，這纔是持續的商業負擔。

Jul 21, 2026

161.1k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

​AI 教父本吉奧宣佈創建 “科學家 AI” 系統，致力於防範智能體欺騙

相關推薦

​打破專用模型桎梏！谷歌 DeepMind 發佈 GenCeption，一個 AI 搞定五大視覺任務

消息稱智元機器人據悉衝刺IPO，目標估值200億美元

美國大模型抄了DeepSeek作業：性能沒贏、價格更貴，卻精準卡住了美國企業的合規剛需

日本Sakana AI放出Fugu Cyber：一個多智能體系統，把GPT-5.5-Cyber和Claude都挑落馬下

Anthropic Fable 5 訓練成本三倍於開源模型，未來面臨挑戰

AI 教父本吉奧宣佈創建 “科學家 AI” 系統，致力於防範智能體欺騙

打破專用模型桎梏！谷歌 DeepMind 發佈 GenCeption，一個 AI 搞定五大視覺任務