遊戲視頻分享平臺Medal近日分拆成立了一家名爲General Intuition的AI研究實驗室,並宣佈完成1. 337 億美元種子輪融資,由Khosla Ventures和General Catalyst領投,Raine參與跟投。這家初創公司利用Medal積累的海量遊戲視頻數據訓練基礎模型和AI智能體,專注於理解物體和實體如何在空間和時間中移動——這一能力被稱爲空間-時間推理。

General Intuition認爲,Medal的數據集在訓練智能體方面優於Twitch或YouTube等替代平臺。該數據集包含來自 1000 萬月活躍用戶的每年 20 億段視頻,覆蓋數萬款遊戲。Medal和General Intuition首席執行官Pim de Witte解釋說,玩家上傳的視頻片段往往是非常負面或正面的極端案例,這恰好爲訓練提供了非常有價值的邊緣數據。"你會得到一種選擇偏差,恰好指向你真正想用於訓練工作的那類數據。"

image.png

這一數據優勢據報道引起了OpenAI的關注。根據The Information的消息,OpenAI去年曾試圖以 5 億美元收購Medal,不過OpenAI和General Intuition均未對此報道發表評論。

從技術進展來看,創始團隊已經取得了一些突破。General Intuition的模型能夠理解未經訓練的環境,並正確預測其中的行動。該模型完全通過視覺輸入來實現這一點——智能體只能看到人類玩家所看到的內容,並通過控制器輸入在空間中移動。公司表示,這種方法可以自然遷移到機械臂、無人機和自動駕駛車輛等物理系統,因爲這些設備通常也是由人類使用遊戲手柄操控的。

General Intuition的下一個里程碑包括兩個方向:生成用於訓練其他智能體的新模擬世界,以及在完全陌生的物理環境中自主導航。

在商業化策略上,General Intuition與其他世界模型開發商有明顯區別。雖然該公司也在構建用於訓練智能體的世界模型,但這些模型本身並非產品。不同於DeepMind和World Labs分別銷售其世界模型Genie和Marble用於訓練智能體和內容創作,General Intuition選擇了其他應用場景以避免版權問題。

de Witte明確表示:"我們的目標不是生產與遊戲開發者競爭的模型。"相反,該公司的遊戲應用專注於創建機器人和非玩家角色,這些角色能夠超越傳統的"確定性機器人"——即每次都產生相同輸出的預編程角色。

General Intuition創始成員、Lightspeed Ventures合夥人Moritz Baier-Lentz表示:"這些機器人可以擴展到任何難度級別。創造一個打敗所有人的無敵機器人沒有吸引力,但如果你能逐步擴展併爲任何玩家情況填補流動性,使他們的勝率始終保持在50%左右,這將最大化他們的參與度和留存率。"

de Witte還有人道主義工作背景,這影響了公司對搜救無人機應用的關注。這類無人機有時需要在沒有GPS的情況下導航陌生環境並提取信息。

從長遠願景來看,de Witte和Baier-Lentz認爲General Intuition的核心功能——空間-時間推理——是通往通用人工智能(AGI)的關鍵部分。當主要AI實驗室專注於構建更強大的大語言模型時,General Intuition認爲真正的AGI需要大語言模型根本缺乏的東西。

de Witte表示:"作爲人類,我們創造文本來描述我們世界中發生的事情,但在這樣做時,你會丟失很多信息。你會失去圍繞空間-時間推理的一般直覺。"

這筆高額種子輪融資反映了投資者對空間智能賽道的看好。不同於通過文本和圖像理解世界的傳統AI模型,空間-時間推理關注的是物理世界中的動態變化和因果關係。General Intuition計劃利用這筆資金擴大研究人員和工程師團隊,訓練能夠與周圍世界互動的通用智能體,初期應用將集中在遊戲和搜救無人機領域。從技術路徑來看,利用遊戲視頻訓練具備物理世界理解能力的AI,代表了一種將虛擬環境經驗遷移到現實任務的新思路。