OpenAI發佈o3：AI 推理能力的重大突破，得分高達 87.5%

OpenAI 正式發佈了其最新的 o-Model 推理系列模型 ——OpenAI o3。作爲繼任者，o3在數學和科學推理方面展現了顯著的進步，引發了業界對其能力與侷限性的廣泛討論。

OpenAI 表示，o3的設計旨在提升處理結構化思維需求的推理能力，尤其是在數學和科學領域。該模型在一項專門的推理基準測試 ARC AGI 中表現優異，得分從之前模型的32% 躍升至87%。這一進步標誌着 o3在解決複雜邏輯和數學問題上的能力有了顯著提升。

o3的性能表現尤爲引人關注。在高級數學測試中，o3的成功率達到96.7%，相比之前的 o1模型提升了近40%。在科學推理方面，o3在解決博士級科學問題時的準確率也提高了10%。此外，o3在理解和調試代碼方面也表現出了良好的能力，這爲軟件開發提供了潛在的實用價值。

OpenAI o3採用了一種混合推理框架，結合了神經符號學習與概率邏輯。這一架構使得模型能夠分解問題，將複雜的查詢簡化爲更小、可管理的部分;同時，o3還能夠利用擴展記憶，保持在長時間互動中的上下文信息，並通過多次推理循環來優化答案。這些特性使 o3特別適合應對傳統變換模型難以勝任的多步推理挑戰。

在實際應用方面，OpenAI o3的潛力巨大，能夠在多個領域發揮作用。例如，在教育領域，它可以幫助學生解決複雜的數學和科學問題;在醫療領域，o3可以通過數據分析支持診斷過程，優化治療方案;在軟件開發中，它則可以協助調試和生成代碼，爲開發者提供實際支持。

OpenAI 還發布了一段視頻，展示了其對 AI 推理的願景，內容涵蓋了 o3在物理、數學和倫理困境等領域的問題解決能力，體現了 OpenAI 希望開發能夠跨越多種場景進行推理的模型的雄心。

劃重點:
🧠 OpenAI o3在 ARC AGI 基準測試中得分87.5%，展現出顯著的推理能力提升。
🔍 在高級數學測試中，o3的成功率達到96.7%，科學推理準確率提升10%。
💻 o3的應用潛力廣泛，能夠在教育、醫療和軟件開發等領域提供實際支持。

AI訓練數據版權爭議迎關鍵判例，印度法院支持模型訓練合法性討論

7月24日，印度法院就印度最大通訊社ANI訴OpenAI版權案作出裁決，認定OpenAI使用ANI新聞訓練AI不構成侵權，並確認印度法院具有管轄權。法院指出，ANI未能提供充分證據證明其原創新聞內容，故不支持其限制數據使用的訴求。此裁定爲AI訓練數據使用的版權爭議提供了重要判例。

英偉達拿下蘇茨克維：投資SSI實驗室，算力版圖再添一枚重磅棋子

據《華爾街日報》報道，英偉達已對前OpenAI首席科學家兼聯合創始人伊爾亞·蘇茨克維的保密實驗室SSI完成實質性投資，金額未公開。核心以大量旗艦GPU換取算力提升一個數量級，此前該實驗室主要依賴谷歌TPU。這標誌着英偉達罕見直接押注前沿AI安全研究。

"抱抱臉"向 OpenAI 索賠 1 億美元算力：智能體失控入侵後，開源社區開出價碼