正文

爆火！學術團隊僅憑SFT打破大廠壟斷，OpenSeeker-v2 登頂搜索智能體榜單

發布於AI新閒資訊

時間 :May 6, 2026

閱讀 :1分鐘

在當前的大模型（LLM）領域，深度搜索能力已成爲頂尖智能體的“必殺技”。然而，這一賽道的遊戲規則長期以來被資源雄厚的工業巨頭所主導。傳統的開發模式通常依賴於極其消耗資源的流水線，包括預訓練、持續預訓練(CPT)、監督微調(SFT)以及強化學習(RL)。

近日，來自學術界的研發團隊發佈了最新成果 OpenSeeker-v2，徹底打破了這一常規認知。研究報告指出，通過使用高質量、高難度的任務軌跡進行訓練，即便僅採用簡單的監督微調（SFT）方法，也能打造出性能頂尖的搜索智能體。

該團隊在數據合成方面提出了三項核心優化策略:首先是擴大知識圖譜規模，以提供更豐富的探索空間;其次是顯著增加工具集數量，擴展功能邊界;最後是實施嚴格的低步數過濾，確保訓練數據的精煉與高效。

實驗數據顯示，僅基於1.06萬條數據點訓練的 OpenSeeker-v2（30B規模，ReAct架構），在四項核心基準測試中展現了極強的統治力:其在BrowseComp上的準確率達到46.0%，在BrowseComp-ZH上爲58.1%，在“人類最後考試”(Humanity's Last Exam)中表現爲34.6%，而在xbench上更是高達78.0%。這一系列成績不僅刷新了紀錄，更全面超越了採用重度CPT+SFT+RL複雜管線訓練的工業界模型——通義DeepResearch。

值得關注的是，這是首個在同等模型規模與架構下，由純學術團隊僅通過SFT技術實現的 state-of-the-art（SOTA）搜索智能體。目前，該團隊已正式開源 OpenSeeker-v2 的模型權重。這一發現極大地降低了前沿搜索智能體的研發門檻，爲學術界和開源社區提供了更具參考價值的輕量化開發路徑。

論文地址：https://arxiv.org/pdf/2605.04036

月之暗面 Kimi 再融資 20 億美元，估值突破 200 億美元

月之暗面旗下Kimi近日完成約20億美元融資，投後估值超200億美元，由美團龍珠領投，中國移動、中信產業基金等參投。年初至今公司已累計融資超39億美元（約376億人民幣），資本動作密集。

May 7, 2026

119.9k

估值四倍躍升，Kimi 成最“燒錢”也最吸金的大模型公司之一

月之暗面（Kimi）即將完成約20億美元新一輪融資，投後估值超200億美元。本輪由美團龍珠領投，出資超2億美元，中國移動、CPE源峯等參投。延續年初高頻融資節奏，1至2月已連續完成三輪共19億美元融資，半年內累計融資近40億美元。

May 6, 2026

215.4k

文心一言5.1預覽版上線 LMSYS 競技場，目前位列全球第13位

百度文心一言5.1預覽版低調上線國際盲測平臺LMSYS Chatbot Arena，最新數據顯示其在總榜排名第13位。這標誌着百度核心模型進入新一輪快速迭代週期，開始接受全球用戶檢驗。雖然官方未公佈具體參數和架構細節，但基於以往迭代邏輯和競技表現，該版本在語義理解方面預計有所提升。

Apr 30, 2026

433.9k

螞蟻集團正式開源萬億級大模型Ling-2.6-1T，主打“快思考”智效比提升

螞蟻集團百靈大模型團隊今日開源萬億級旗艦模型Ling-2.6-1T，該模型不追求參數堆疊，而是優化指令執行、工具適配及長上下文能力。其創新混合架構通過強化獎勵策略降低Token開銷，實現高效“快思考”機制。

Apr 30, 2026

234.3k

估值飆升至 9000 億美元，Anthropic或開啓IPO前最後一輪鉅額融資

Anthropic近期受資本追捧，多家機構計劃以約9000億美元估值注資500億美元。其年度經常性收入已突破300億美元，較2025年底的90億美元大幅增長，營收指數級上升引發投資者狂熱。

Apr 30, 2026

235.1k

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

爆火！學術團隊僅憑SFT打破大廠壟斷，OpenSeeker-v2 登頂搜索智能體榜單

相關推薦

月之暗面 Kimi 再融資 20 億美元，估值突破 200 億美元

估值四倍躍升，Kimi 成最“燒錢”也最吸金的大模型公司之一

文心一言5.1預覽版上線 LMSYS 競技場，目前位列全球第13位

螞蟻集團正式開源萬億級大模型Ling-2.6-1T，主打“快思考”智效比提升

估值飆升至 9000 億美元，Anthropic或開啓IPO前最後一輪鉅額融資