當全球AI競賽仍聚焦於語言模型的參數與上下文長度時,人工智能先驅李飛飛(Fei-Fei Li)發出振聾發聵的警示:真正的智能,從來不只是“會說話”——而是理解並駕馭物理世界的能力,即“空間智能”(Spatial Intelligence)。在最新博客中,她明確指出:若AI無法掌握空間推理、物體關係與動態預測,所謂的“通用人工智能”終將是空中樓閣。

空間智能:人類智能的原始引擎

李飛飛強調,空間智能是人類認知的基石,遠早於語言出現。從嬰兒伸手抓握玩具,到科學家通過X射線衍射圖推演出DNA雙螺旋結構;從古希臘人用影子測算地球周長,到工程師設計自動駕駛路徑——這些突破無不依賴對空間、形狀、運動與因果關係的深刻理解。而當前主流大模型雖能流暢生成文本,卻對“杯子放在桌子邊緣是否會掉落”這類基礎物理常識頻頻出錯。

image.png

超越“下一個詞預測”:構建AI的“世界模型”

要突破這一瓶頸,李飛飛提出必須構建新一代世界模型(World Model)——一種能對物理環境進行生成、交互與狀態預測的多模態系統。該模型需具備三大核心能力:

感知三維甚至四維(含時間),而非僅處理二維圖像;

理解動作與結果的因果鏈,例如“推倒積木塔”後的連鎖反應;

通過主動交互學習,而非被動接受標註數據。

實現這一目標面臨三大挑戰:新型訓練範式(替代“下一個詞預測”)、從海量視頻中提取深層空間結構、以及支持3D/4D推理的新神經架構。目前,李飛飛團隊正全力攻關,試圖將計算機視覺、具身智能與生成式AI深度融合。

三階段落地:從創意到科學,重塑人類生產力

李飛飛描繪了空間智能的演進路徑:

近期:賦能電影、遊戲與虛擬敘事,實現更真實的動態場景生成;

中期:讓服務機器人真正理解家庭環境,安全遞送物品、協助老人;

長期:推動科學發現(如分子摺疊模擬)、精準醫療(手術路徑規劃)與沉浸式教育。

AI的使命是增強人類,而非取代

在技術狂熱中,李飛飛不忘重申其一貫立場:“AI的終極目標不是替代人類,而是擴展人類的能力邊界。”她呼籲學界、產業界共建開放、負責任的空間智能生態,確保技術紅利普惠全人類。

AIbase認爲,李飛飛的宣言不僅是技術路線的轉向,更是對AI發展哲學的校準。當行業從“語言幻覺”迴歸“物理現實”,AI才真正有望走出聊天窗口,走進工廠、實驗室與千家萬戶。這場空間智能革命,或許正是通往真正智能機器的唯一通路。