隨着大語言模型(LLM)和視覺 - 語言模型(VLM)的迅速發展,智能體在知識發現和問題解決的方式上正在經歷革命性的變化。然而,許多現有的開源智能體框架過於依賴昂貴的付費工具,這在很大程度上限制了它們的可復現性和普適性。爲此,騰訊 AI Lab 推出了全新開源的智能體框架 ——Cognitive Kernel-Pro,旨在最大限度地降低外部依賴,使更多研究人員和開發者能夠輕鬆參與智能體的開發和訓練。

image.png

Cognitive Kernel-Pro 採用了多模塊、層次化的設計,主要由主智能體和多個子智能體組成。主智能體負責任務分解和信息整合,而子智能體則專注於特定任務,如網頁瀏覽和文件處理。這種模塊化結構確保了各部分的獨立性和擴展性。

爲了提升複雜任務的處理效率,Cognitive Kernel-Pro 引入了 “進度狀態” 機制,智能體可以記錄已完成的步驟和待辦任務。此外,框架通過簡單的文本接口實現主智能體和子智能體之間的高效通信,便於協作與調試。同時,反思和投票機制的引入,進一步優化了智能體的任務完成質量,特別是在網頁瀏覽等高隨機性的任務中。

在性能方面,Cognitive Kernel-Pro 在 GAIA 基準測試中表現出色,超越了其他開源框架 SmolAgents,接近那些依賴付費工具的智能體。這一成果得益於其創新的訓練方法,涵蓋網頁導航、文件處理和推理等多個領域。

除了強大的框架設計,騰訊 AI Lab 還提供了 Agent Foundation Model 的訓練配方,進一步推動了社區的研究和發展。相關代碼和技術報告已在 GitHub 上公開,供大家共同探索與利用。

項目地址:https://github.com/Tencent/CognitiveKernel-Pro