Kimi推出數學推理模型k0-math：數學能力對標OpenAI o1系列

月之暗面Kimi智能助手宣佈推出新一代數學推理模型k0-math。k0-math模型在多項數學基準能力測試中表現突出，其成績在中考、高考、考研以及包含入門競賽題的MATH等4個數學基準測試中超過了OpenAI o1系列的o1-mini和o1-preview模型。

微信截圖_20241118075443.png

特別是在MATH測試中，k0-math模型得分93.8，僅次於o1完全版的94.8分。儘管在競賽級別的OMNI-MATH和AIME基準測試中，k0-math初代模型的表現分別達到了o1-mini最高成績的90%和83%，但公司計劃持續迭代，以提升更難題目的解題能力。

k0-math模型採用了全新的強化學習和思維鏈推理技術，通過模擬人腦的思考和反思過程，大幅提升瞭解決數學難題的能力。

該模型在解題過程中會花費更多時間進行推理，包括思考和規劃思路，並在必要時自行反思改進解題思路，以提升答題成功率。

儘管k0-math模型在解答大部分有難度的數學題方面表現出色，但當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題，且對於過於簡單的數學問題可能會過度思考，對高考難題和IMO題目也有一定概率做錯。

月之暗面 Kimi 推出首個內容社區，開啓用戶互動新模式

月之暗面近日宣佈正在進行其首個內容社區產品的灰度測試，旨在提升用戶體驗和留存率。這款名爲 Kimi 的產品早在去年底就開始了小範圍的試用，目前終於迎來了更廣泛的測試階段。據澎湃新聞報道，月之暗面是一家成立於2023年3月的公司，由有着清華背景的楊植麟團隊領導。創始團隊的核心成員曾參與多個知名大模型的研發，包括 Google 的 Gemini 和 Bard 等。去年10月，該公司推出的 Kimi 智能助手一度引發熱議，因其能夠支持輸入高達20萬漢字，並在不久後升級至200萬字，超越了許多同期競

AIGC 應用月活躍用戶破億，豆包獨佔市場一半

根據研究機構 QuestMobile 的最新數據顯示，截至2024年11月底，中國的 AIGC（人工智能生成內容）應用月活躍用戶已經突破了1億大關。其中，字節跳動旗下的豆包表現突出，憑藉其強大的用戶基礎，獨佔了市場的一半用戶。與此同時，百度的文小言與月之暗面開發的 Kimi 智能助手也在市場中佔據了一席之地。隨着 AIGC 應用的快速增長，用戶數量逐漸向頭部企業集中。根據數據顯示，豆包在2024年上半年用戶數量實現了大幅增長，從6月底的2751萬躍升至11月的5600萬。Kimi 智能助手也表現不俗，自10

Kimi 數學版來了，用科學思維解讀生活

Kimi 官方宣佈Kimi 數學版上線，用戶可以通過訪問 Kimi 網頁（kimi.ai），找到側邊欄的「眼鏡」圖標，開始與由 k0-math 模型驅動的 Kimi 數學版進行互動。這一新功能旨在通過數學公式幫助用戶更好地理解和應用數學知識。Kimi 數學版不僅侷限於簡單的數學運算，其設計理念源於熱門電視劇《生活大爆炸》中角色 Sheldon 的理科思維。Kimi 數學版能夠用科學的方法和思維模式來解釋生活中的各種現象，幫助用戶從更深層次去理解身邊的世界。此外，用戶還可以邀請 Kimi 數學版一起玩經典的24點遊戲

月活超3600萬！Kimi探索版搜索再進化：引入三大推理能力

月之暗面旗下Kimi智能助手宣佈 Kimi 探索版再進化，引入搜索意圖增強、信源分析和鏈式思考三大推理能力。意圖增強能力使Kimi探索版能夠將抽象和模糊的問題具體化，拓展用戶的真實搜索意圖。信源分析能力讓Kimi探索版從大量搜索結果中篩選出更具權威性和可靠性的信源，並提供溯源鏈接，精確到段落級別。鏈式思考能力則使Kimi探索版能夠基於思維鏈推理能力處理產品、公司、行業等研究問題。

Kimi推出數學推理模型k0-math：數學能力對標OpenAI o1系列

相關推薦

Kimi公開喊話“找錯人”:百度搜索前四竟無一官網，迴應後已光速“消痕”

月之暗面 Kimi 推出首個內容社區，開啓用戶互動新模式

AIGC 應用月活躍用戶破億，豆包獨佔市場一半

Kimi 數學版來了，用科學思維解讀生活

月活超3600萬！Kimi探索版搜索再進化：引入三大推理能力