位於舊金山的人工智能初創公司 Prime Intellect 正式發佈“環境中心”(Environments Hub),這是一個用於構建和共享強化學習(RL)環境的開放平臺,旨在對抗當前由大型人工智能實驗室主導的封閉生態。
Prime Intellect 指出,交互式訓練環境已成爲下一階段 AI 發展的關鍵瓶頸。在強化學習中,AI 代理通過與規則驅動的環境互動來學習,僅在面對動態變化時才能實現真正的智能。“如果沒有環境交互,強化學習就只是數學。”公司如是表示。

近年來,多個大型實驗室投入巨資開發專有 RL 環境,逐步將訓練數據私有化。這種趨勢正使得開源社區越來越難以訓練出具備競爭力的 AI 模型。Prime Intellect 希望通過環境中心提供一個開放替代方案,避免被“圍牆花園”所束縛。
環境中心將支持下代開源模型 INTELLECT-3
Prime Intellect 計劃將環境中心作爲其下一代開源代理模型 INTELLECT-3 的數據引擎。該模型將基於來自社區貢獻的 RL 環境數據進行訓練,被定位爲“完全開放、最先進的代理模型”。
爲推動環境建設,Prime Intellect 發佈了一系列現金獎勵任務,尋找能評估代碼質量、支持長時間運行任務、甚至能促進創意寫作的強化學習環境。目標是降低開發門檻,讓更多開發者能夠參與先進 AI 模型的構建。
去中心化團隊與明星投資陣容
Prime Intellect 由 Vincent Weisser(曾活躍於 DeSci 去中心化科學領域)和 Johannes Hagemann(曾在 Aleph Alpha 領導大模型訓練)聯合創立。公司致力於去中心化 AI、共享算力資源,並在分佈式系統中訓練模型。
此前,Prime Intellect 已從 Founders Fund、Andrej Karpathy、以及 Hugging Face CEO Clem Delangue 等投資人處籌集了 2050萬美元。今年早些時候,該公司曾推出去中心化模型 INTELLECT-2,作爲其開源路線圖的一部分
