OpenAI 推出新 AI 安全方法，可主動推理規則拒絕危險請求！

OpenAI 公佈了一種新的 AI 安全方法，旨在通過改變 AI 系統處理安全規則的方式來提升其安全性。這種新的 o 系列模型不再僅僅依賴於通過示例學習好與壞行爲，而是能夠理解並積極推理特定的安全指南。

OpenAI 的研究中舉了一個例子，當用戶試圖通過加密文本獲取非法活動的指示時，模型成功解碼了信息，但拒絕了請求，並具體引用了將要違反的安全規則。這種逐步推理的過程顯示了模型如何有效地遵循相關的安全準則。

這款 o1模型的訓練過程分爲三個階段。首先，模型學習如何提供幫助。接下來，通過監督學習，模型會研究特定的安全指南。最後，模型使用強化學習來實踐應用這些規則，這一步驟幫助模型真正理解並內化這些安全指南。

在 OpenAI 的測試中，新推出的 o1模型在安全性方面表現顯著優於其他主流系統，如 GPT-4o、Claude3.5Sonnet 和 Gemini1.5Pro。測試內容包括模型如何拒絕有害請求並允許合適請求的通過，結果顯示 o1模型在準確性和抵禦越獄嘗試方面均取得了最高分。

OpenAI 的聯合創始人沃伊切赫・扎倫巴在社交平臺上表示，他對這種 “深思熟慮的對齊” 工作感到非常自豪，認爲這種推理模型可以以一種全新的方式進行對齊，特別是在發展人工通用智能（AGI）時，確保系統與人類價值觀保持一致是一項重大挑戰。

儘管 OpenAI 聲稱取得了進展，然而名爲 “解放者普林尼” 的黑客仍然展示了即便是新的 o1和 o1-Pro 模型也能被操縱以突破安全指南。普林尼成功讓模型生成成人內容，甚至分享製作莫洛托夫雞尾酒的指示，儘管系統起初拒絕了這些請求。這些事件凸顯控制這些複雜 AI 系統的難度，因爲它們是基於概率而非嚴格規則進行操作。

扎倫巴表示，OpenAI 有約100名員工專門從事 AI 安全和與人類價值觀保持一致的工作。他對競爭對手的安全處理方式提出了質疑，尤其是埃隆・馬斯克的 xAI 公司優先考慮市場增長而非安全措施，而安瑟羅比（Anthropic）最近推出了一款沒有適當保障的 AI 代理，扎倫巴認爲這會給 OpenAI 帶來 “巨大的負面反饋”。

官方博客:https://openai.com/index/deliberative-alignment/

劃重點:
🌟 OpenAI 的新 o 系列模型能主動推理安全規則，提升系統安全性。
🛡️ o1模型在拒絕有害請求和準確性方面表現優於其他主流 AI 系統。
🚨 儘管有改進，但新的模型仍可能被操縱，安全挑戰依舊嚴峻。

OpenAI聯手吳恩達推出o1系列模型免費課程，聚焦深度推理能力開發

OpenAI與人工智能領域泰斗、斯坦福大學教授吳恩達攜手推出了一門重磅免費課程"Reasoning with o1"。這門由OpenAI戰略解決方案架構主管Colin Jarvis執教的課程，旨在幫助開發者深入掌握o系列模型的高級推理能力。課程地址:https://www.deeplearning.ai/short-courses/reasoning-with-o1o系列模型是OpenAI在2024年推出的新一代AI模型。與傳統大語言模型相比，該系列最顯著的特點是通過更深入的"思考"過程來處理複雜問題。通過在推理時執行思維鏈分析，o系列模型在多步驟規劃、圖像推理和長期編碼等新興應用場景中

美圖AI短片工具MOKI會員功能上線：接入VIDU、可靈AI大模型

在AI視覺創作領域，MOKI短片工具近日宣佈了其最新升級，引入了備受期待的會員功能，並接入了VIDU和可靈AI兩大模型，進一步豐富了創作者的創作體驗。此次更新不僅保留了原有的美圖奇想大模型，還通過新增的VIDU和可靈AI大模型，爲動畫場景、運動效果和可控性提供了定製化的優化，以滿足不同創作者的需求。

智元機器人開源全球首個百萬真機數據集AgiBot World

近日，上海機器人初創公司智元機器人聯合上海人工智能實驗室、國家地方共建人形機器人創新中心以及上海庫帕思，正式開源百萬真機數據集AgiBot World，旨在支持泛化和通用的機器人大模型訓練。據悉，這是全球首個基於全域真實場景、全能硬件平臺、全程質量把控的百萬真機數據集。AgiBot World數據集誕生於智元自建的大規模數據採集工廠與應用實驗基地，空間總面積超過4000平方米，包含3000多種真實物品，復刻了家居、餐飲、工業、商超和辦公五大核心場景，收錄了80多種日常生活中的

Nvidia 成功收購 Run:ai 並決定開源其 GPU 管理軟件

美國科技公司 Nvidia 近日完成了對以色列軟件公司 Run:ai 的收購，雙方的合作將進一步提升 AI 雲計算的管理效率。雖然具體收購金額未披露，但據報道，該交易價值約爲7億美元。Nvidia 宣佈將開源 Run:ai 的軟件，以便更廣泛地支持 AI 生態系統。Run:ai 的核心軟件可以幫助客戶高效調度 Nvidia GPU 資源，進而優化 AI 運算的性能。此次開源的決定雖然沒有詳細說明原因，但業內普遍認爲，Nvidia 的市值已達到3.56萬億美元，成爲全球最有價值的公司，這讓它在收購其他公司時面臨更大的反壟斷審查壓

可靈AI API對口型能力全面開放、虛擬試穿升級至V1.5模型

北京快手科技有限公司近日宣佈，其自主研發的視覺生成大模型可靈AI（Kling）API完成了新一輪的能力升級。升級後的可靈AI API在虛擬試穿和對口型兩大功能上實現了顯著進步，爲電商、廣告營銷、泛娛樂及AI工具領域的客戶提供了更爲強大的技術支持。