近日,北京月之暗面科技有限公司宣佈其旗下智能助手 Kimi 迎來了重大技術升級,推出了全新的 k1.5多模態思考模型。這一模型在多模態推理和通用推理能力上達到了行業領先水平,標誌着 Kimi 在人工智能領域的又一次突破性進展。

k1.5多模態思考模型是 Kimi 在短短三個月內第三次對其 k 系列強化學習模型進行重磅升級。繼去年11月發佈的 k0-math 數學模型和12月發佈的 k1視覺思考模型之後,k1.5模型在基準測試中表現卓越。在 short-CoT 模式下,k1.5的數學、代碼、視覺多模態和通用能力大幅超越了全球範圍內短思考 SOTA 模型 GPT-4o 和 Claude3.5Sonnet 的水平,領先幅度高達550%。而在 long-CoT 模式下,k1.5的數學、代碼和多模態推理能力也達到了長思考 SOTA 模型 OpenAI o1正式版的水平,這在全球範圍內是 OpenAI 之外的公司首次實現 o1正式版的多模態推理性能。

此次升級的背後是 Kimi 技術團隊的不懈努力和創新。團隊首次公開了詳細的模型訓練技術報告《Kimi k1.5:藉助大語言模型實現強化學習的 Scaling》,記錄了新技術範式下的模型訓練探索之路。

微信截圖_20250121082016.png

報告指出,k1.5模型的關鍵創新包括長上下文擴展,通過部分展開技術提高訓練效率,同時觀察到上下文長度的增加能夠持續提升模型性能。此外,改進的策略優化方法和簡潔的框架設計也爲模型的強大性能提供了支持。值得注意的是,k1.5模型在文本和視覺數據上進行了聯合訓練,具備了聯合推理兩種模態的能力,尤其在數學能力方面表現出色,儘管在處理部分依賴圖形理解的幾何圖形題時仍存在挑戰。

爲了進一步提升短鏈思維推理能力,團隊還提出了有效的 long2short 方法,利用 Long-CoT 技術改進 Short-CoT 模型,在 AIME、MATH500和 LiveCodeBench 等測試中取得了顯著成績,大幅超越了現有的短鏈思維模型,如 GPT-4和 Claude Sonnet3.5。

k1.5多模態思考模型的預覽版將陸續灰度上線 Kimi.com 網站和最新版本的 Kimi 智能助手 app。用戶在使用過程中如果發現模型切換按鈕,即可體驗這一全新升級的模型。k1.5模型擅長深度推理,能夠幫助用戶解決複雜的代碼問題、數學問題和工作難題。

月之暗面科技有限公司表示,2025年將繼續沿着既定路線圖加速升級 k 系列強化學習模型,帶來更多模態、更多領域的能力和更強的通用能力,爲用戶解鎖更多可能性。

github 報告鏈接:https://github.com/MoonshotAI/kimi-k1.5