一款名爲 Kimi-Dev-72B 的開源代碼大型語言模型(LLM)現已推出,旨在革新軟件工程領域的問題解決方式。該模型在 SWE-bench Verified 基準測試中展現出最先進的性能,尤其擅長自主修復 Docker 環境中的真實代碼倉庫。

QQ20250617-095538.png

Kimi-Dev-72B 的核心優勢在於其通過大規模強化學習進行優化。它能夠獨立識別並修復代碼缺陷,並在整個測試套件通過時獲得獎勵,從而確保所提供的解決方案不僅正確,而且魯棒。

該項目已在 Hugging Face 和 GitHub 上開源,開發者可以自由下載和部署。Kimi-Dev-72B 提供了一個簡化的兩階段框架,專門用於代碼修復和測試編寫任務,包括精準的文件定位和高效的代碼編輯功能。這使得它成爲開發者進行問題排查和代碼維護的強大工具。

地址:https://github.com/MoonshotAI/Kimi-Dev