月之暗面發佈首款自主智能體 Kimi-Researcher

月之暗面（Moonshot AI）今日推出其備受期待的 Kimi 研究功能，正式加入日益激烈的 AI 智能體(Agent)競爭。據稱，該功能在多項基準測試中表現出色，尤其在名爲“人類終極考驗”(Humanity's Last Exam，HLE)的測試中，其性能超越了谷歌和 OpenAI 的同類產品，一舉登頂。

Kimi-Researcher:強大的多輪搜索與推理智能體

Kimi 研究功能的核心是 Kimi-Researcher，這是一款擅長多輪搜索與推理的自主智能體。根據官方數據，在執行每個任務時，Kimi-Researcher 平均會進行23個推理步驟，並瀏覽超過200個網址，展現出強大的信息處理和分析能力。

基準測試表現:HLE 登頂，RL 訓練效果顯著

Kimi-Researcher 基於 Kimi k-系列模型的內部版本構建，並完全通過端到端的智能體強化學習（RL）進行訓練。在“人類終極考驗”(HLE)這項測試中，它取得了26.9% 的 Pass@1得分率，達到了業界頂尖水平;其 Pass@4準確率更是高達40.17%。

值得注意的是，Kimi-Researcher 的 HLE 初始得分僅爲8.6%，最終能達到26.9% 的高分，幾乎完全得益於端到端的強化學習訓練。月之暗面表示，這有力地證明了端到端智能體強化學習可以極大地推動智能體智能水平的提升。

此外，Kimi-Researcher 在多個複雜且具挑戰性的真實世界基準測試中也表現出色。例如，在 xbench 測試（一套全新的、動態的、與專業需求對齊的測試套件）的 xbench-DeepSearch 項目上，Kimi-Researcher 取得了69% 的 Pass@1(4次運行平均值)，其表現優於配備了搜索工具的 o3等模型。在針對多輪搜索推理(如 FRAMES、Seal-0)和事實性信息問答(如 SimpleQA)的基準測試中，Kimi-Researcher 同樣表現出色。

開源計劃與內測申請

月之暗面宣佈，Kimi-Researcher 將於今日起逐步向用戶開放，現在用戶可以訪問 kimi.com 申請內測。更令人振奮的是，未來幾個月內，月之暗面將開源 Kimi-Researcher 背後的基礎預訓練模型以及經過強化學習訓練後的模型，這將爲 AI 社區的發展帶來重要貢獻。

GitHub：https://moonshotai.github.io/Kimi-Researcher/

開源AI設計工具Jaaz發佈 Lovart AI的本地化免費替代品

一款名爲Jaaz的開源AI設計工具在開發者社區引發熱議，被譽爲Lovart AI的本地化免費替代品。Jaaz利用先進的AI模型與圖像生成技術，支持通過聊天對話完成圖像設計、編輯及生成，涵蓋海報、故事板等多種創意場景。其強大的功能和本地運行特性爲設計師提供了高效、靈活的創作體驗。開源設計新星:Jaaz的獨特定位Jaaz定位爲Lovart AI的開源替代品，專爲需要本地化運行的設計師和開發者打造。區別於依賴雲服務的Lovart AI，Jaaz支持完全本地部署，兼容Stable Diffusion、Flux.1Dev等開源圖像生成模型，

火山引擎上線"AI 智能推薦域名"功能

近日，火山引擎域名服務正式上線了一項基於方舟大模型平臺的創新應用——“AI智能域名推薦”，旨在幫助企業簡化域名註冊流程，快速找到並註冊到符合品牌需求的熱門域名。該服務依託於火山引擎強大的方舟大模型平臺，具備語義理解能力。用戶只需輸入關鍵詞，如品牌名、

Meta 發佈新款高性能 AI 眼鏡，助力運動愛好者 “解放雙手”

近日，Meta 與知名運動品牌歐克利（Oakley）合作推出了一款新型 AI 眼鏡 ——Oakley Meta HSTN Performance。這款眼鏡的設計旨在滿足運動場景的需求，定位爲高性能 AI 眼鏡。這是 Meta 首次與 Ray-Ban 之外的品牌聯手推出 AI 眼鏡，標誌着其進軍高端市場的重要一步。新款 AI 眼鏡的核心功能包括拍照、聽音樂、接打電話以及與 Meta AI 的互動。用戶可以通過語音隨時向 Meta AI 提問，控制眼鏡進行拍照或錄製視頻，並能一鍵將內容分享給朋友。這種功能在運動時尤其實用，可以讓用戶 “解放雙手”。Oakle

馬斯克宣告：Grok 4 將重塑人類知識庫，AI 知識審覈新紀元來臨！

近日，埃隆・馬斯克在 X 社交平臺上發佈了一項引人注目的計劃，宣佈將利用新一代大模型 Grok3.5（或稱 Grok4）來重寫整個人類知識庫。馬斯克的目標是將知識庫中的錯誤信息刪除，並填補其中的空白，以構建一個 “純淨版” 的知識體系，隨後基於這一知識庫重新訓練 AI 模型。馬斯克在其聲明中指出，當前許多基於未修正數據訓練的基礎模型中，存在着大量的不實信息。他希望 Grok 能成爲知識界的 “審查官”，不僅對現有知識進行校正，還能夠進行信息補全。新一代 Grok 模型將具備更強

馬斯克要讓 Grok 擺脫“傳統媒體”，改寫整個人類知識體系

埃隆·馬斯克正計劃對他的 xAI 語言模型 Grok 進行一項大膽的“再教育”，旨在用他所謂的“分裂性事實”（politically incorrect， but factually true）來重新訓練它。馬斯克已在 X 平臺上公開徵集此類言論示例，這些內容將用於未來 Grok3.5（或 Grok4）的新一輪訓練。馬斯克表示，此舉的目標是讓 Grok 獲得“高級推理”技能，並“重寫整個人類知識庫，添加缺失信息並刪除錯誤”。他認爲，目前的基礎模型受未經校正的數據影響，包含了“太多垃圾”，導致 Grok 正在“重複傳統媒體”的論調。新模