月之暗面Kimi智能助手宣佈推出新一代數學推理模型k0-math。k0-math模型在多項數學基準能力測試中表現突出,其成績在中考、高考、考研以及包含入門競賽題的MATH等4個數學基準測試中超過了OpenAI o1系列的o1-mini和o1-preview模型。

特別是在MATH測試中,k0-math模型得分93.8,僅次於o1完全版的94.8分。儘管在競賽級別的OMNI-MATH和AIME基準測試中,k0-math初代模型的表現分別達到了o1-mini最高成績的90%和83%,但公司計劃持續迭代,以提升更難題目的解題能力。
k0-math模型採用了全新的強化學習和思維鏈推理技術,通過模擬人腦的思考和反思過程,大幅提升瞭解決數學難題的能力。
該模型在解題過程中會花費更多時間進行推理,包括思考和規劃思路,並在必要時自行反思改進解題思路,以提升答題成功率。
儘管k0-math模型在解答大部分有難度的數學題方面表現出色,但當前版本還無法解答LaTeX格式難以描述的幾何圖形類問題,且對於過於簡單的數學問題可能會過度思考,對高考難題和IMO題目也有一定概率做錯。
