月之暗面今日宣佈發佈全新視覺思考模型k1。這一模型基於強化學習技術,不僅支持端到端的圖像理解,還整合了思維鏈技術,將能力擴展到了數學之外的更多基礎科學領域,包括物理和化學。在基準能力測試中,k1模型的表現超越了全球領先的標杆模型,如OpenAI的o1、GPT-4o以及Claude3.5Sonnet。
新一代模型通過激勵生成更詳細的推理步驟,形成高質量的思維鏈,顯著提升瞭解決複雜任務的成功率。Kimi的k1模型在圖像理解與思考能力上的融合,爲用戶提供了更流暢的交互體驗,能夠直接處理用戶輸入的圖像信息並得出答案,無需藉助外部的OCR或額外視覺模型。
k1模型的訓練分爲兩個階段,首先是預訓練得到基礎模型,然後在此基礎上進行強化學習後訓練。基礎模型在OCRBench上取得了903分的優異成績,並在MathVista-testmini、MMMU-val和DocVQA基準測試集中表現突出。強化學習後訓練在數據質量和學習效率方面進行了優化,實現了規模化上的新突破。
Kimi還自主構建了一個標準化測試集Science Vista,涵蓋不同難度的數理化圖片題目,並將開放給全行業使用。儘管k1模型在內部測試中顯示出一些侷限性,如在分佈外泛化、複雜問題上的成功率等方面有提升空間,但其在視覺噪聲場景下的表現優於其他模型,顯示出超強的視覺識別能力。
Kimi智能助手的k1視覺思考模型不僅在數學領域表現出色,還擴展到了物理和化學領域,展現出了廣泛的基礎科學能力。此外,k1模型還展現出了通用能力,能夠解釋和推理非數學問題,如科學家手稿的內容和背景故事。
Kimi智能助手期待與用戶一起探索更大的世界,k1新模型已經上線,用戶可以通過最新版的Kimi智能助手手機APP或網頁版體驗這一新功能。