新加坡初創公司 Sapient Intelligence 最近推出了一種創新的人工智能架構,名爲 “層次推理模型”(HRM)。該模型在複雜推理任務中能夠與現有的大型語言模型(LLMs)相媲美,甚至在某些情況下表現更佳,且其數據需求和模型規模均遠低於傳統模型。HRM 的設計理念源自人類大腦,旨在通過不同的思維繫統實現高效推理。

image.png

當前的 LLMs 在解決複雜問題時,通常依賴於鏈式思維(CoT)方法,通過生成一系列文本步驟來進行推理。雖然這一方法在一定程度上提升了模型的推理能力,但也存在明顯的不足。研究人員指出,鏈式思維依賴於人爲定義的步驟,一旦出現錯誤,可能導致整個推理過程的失敗。因此,Sapient Intelligence 的研究團隊提出了一種新方式,即 “潛在推理”。該方式使得模型能夠在內部抽象的空間中進行推理,而不是僅僅依賴於文本生成。

HRM 由兩個相互作用的模塊構成:一個是高層模塊,負責緩慢而抽象的規劃;另一個是低層模塊,進行快速而詳細的計算。這種層次化的設計使 HRM 在進行深度推理時,無需依賴大量的輸入數據。測試結果表明,HRM 在處理如抽象推理和複雜數獨等高難度任務時,取得了優異的成績,展現了其在複雜任務中的強大能力。

除了準確性,HRM 還在推理速度方面表現出色。根據 Sapient Intelligence 的創始人王冠的介紹,HRM 在執行特定複雜推理任務時,能夠實現 “任務完成時間的100倍提速”。這意味着 HRM 能夠在邊緣設備上快速進行強大的推理計算,顯著降低企業的時間和成本。

image.png

展望未來,Sapient Intelligence 正在努力將 HRM 發展爲一種更通用的推理解決方案,計劃將其應用於醫療、氣候預測和機器人等多個領域。這一發展標誌着,未來 AI 的成功之道,可能並不在於簡單地擴大模型規模,而是借鑑人類大腦的結構,開發出更智能、更高效的推理架構。

劃重點:  

🚀 HRM 通過新型層次化架構,在複雜推理任務中超越大型語言模型,且需要更少的數據。  

🔍 HRM 模型結合高層和低層模塊,提升了推理速度和效率。  

💼 未來 AI 可能更多地借鑑人類大腦的設計,而非單純依賴於規模擴大。