近日,月之暗面旗下的Kimi智能助手宣佈其首個Agent產品——Kimi-Researcher(深度研究)正式開啓小範圍灰度測試。這一基於端到端自主強化學習(end-to-end agentic RL)技術訓練的新一代Agent模型,旨在爲用戶提供高效、深入的深度研究服務。
Kimi-Researcher在面對問題時,展現出強大的自主規劃與執行能力。它不僅能夠主動澄清問題、深入思考,還能自主規劃關鍵詞進行搜索,並篩選出高質量的信息。在處理任務時,Kimi-Researcher平均會進行23步推理,規劃74個關鍵詞,並找到206個網址,最終只保留信息質量最高的前3.2%內容。這一過程確保了研究成果的詳實與可溯源性。
除了強大的信息搜索與篩選能力外,Kimi-Researcher還能自主調用瀏覽器、代碼等工具,處理原始數據並自動生成分析結論。其交付成果包括一份信息詳實、可溯源的深度研究報告,以及一個可交互、可分享的動態可視化報告。這些報告不僅長度在萬字以上,平均引用約26個高質量信源,還支持在線生成鏈接並分享,極大地方便了用戶的展示與協作需求。
爲了驗證Kimi-Researcher的真實能力,月之暗面爲其安排了一場高難度的“考試”——Humanity’s Last Exam(HLE)。這套專爲AI設計的高難度benchmark覆蓋了上百個專業領域,從數學、物理、醫學到政治、歷史,全面考察模型在複雜知識任務中的解決能力。Kimi-Researcher在完全零結構、無流程設計的設置下,取得了Pass@1準確率26.9%、Pass@4準確率40.17%的優異成績,超越了多個知名AI模型,達到了目前已知的最高水平之一。
在真實場景的應用中,Kimi-Researcher同樣展現出了出色的表現。無論是算法同學尋找高價值的benchmark、運營同學研究行業內的公司發展,還是法務朋友快速瞭解各國數據隱私法規,Kimi-Researcher都能在短時間內生成結構清晰、信息全面的報告,爲用戶提供有力的支持。
月之暗面表示,Kimi-Researcher是通過端到端強化學習訓練出來的Agent模型,具有零結構、自適應的特點。它沒有複雜的提示詞或預設流程,而是完全依靠模型自身的試錯與學習來應對複雜任務。這種設計使得Kimi-Researcher在面對信息衝突、工具切換和環境變化時,能夠展現出強大的適應性與泛化能力。
目前,Kimi-Researcher正處於小範圍灰度測試階段。用戶可以通過訪問kimi.com申請內測資格,並在獲得權限後打開Kimi對話框下方的“深度研究”按鈕開始使用。