正文

Kimi-Dev-72B：開源編碼LLM，賦能軟件工程問題解決

發布於AI新閒資訊

時間 :Jun 17, 2025

閱讀 :1分鐘

一款名爲 Kimi-Dev-72B 的開源代碼大型語言模型（LLM）現已推出，旨在革新軟件工程領域的問題解決方式。該模型在 SWE-bench Verified 基準測試中展現出最先進的性能，尤其擅長自主修復 Docker 環境中的真實代碼倉庫。

Kimi-Dev-72B 的核心優勢在於其通過大規模強化學習進行優化。它能夠獨立識別並修復代碼缺陷，並在整個測試套件通過時獲得獎勵，從而確保所提供的解決方案不僅正確，而且魯棒。

該項目已在 Hugging Face 和 GitHub 上開源，開發者可以自由下載和部署。Kimi-Dev-72B 提供了一個簡化的兩階段框架，專門用於代碼修復和測試編寫任務，包括精準的文件定位和高效的代碼編輯功能。這使得它成爲開發者進行問題排查和代碼維護的強大工具。

地址:https://github.com/MoonshotAI/Kimi-Dev

OpenAI聯合創始人Andrej Karpathy宣佈加盟Anthropic，發力下一代LLM研發

OpenAI聯合創始人兼前特斯拉自動駕駛負責人Andrej Karpathy加入Anthropic，加劇了AI人才向OpenAI主要競爭對手的流動。此前OpenAI已有多位核心骨幹離職，Karpathy將專注於大型語言模型的底層架構與深層集成研究。

字節跳動開源生物分子結構預測模型Protenix-v1，完整復現AlphaFold3核心能力，支持蛋白質、核酸及小分子配體的全原子3D結構預測，打破技術壁壘。

日本數據科學家本田崇人推出開源編程語言“Sui”，旨在解決大語言模型生成代碼的準確性問題，宣稱可實現100%準確率。其設計理念源於日本美學“粋”，強調精煉與去除冗餘，核心原則包括保證零語法錯誤率，並使用數字作爲變量。

南洋理工大學推出首個全面評測大型語言模型處理電子病歷能力的基準EHRStruct，涵蓋11項核心任務、2200個樣本，旨在評估模型在醫療數據理解、信息提取等方面的表現，推動醫療AI發展。

MIT研究團隊開發出實例自適應縮放技術，可根據問題複雜度動態調整大型語言模型的計算資源，提升效率並降低能耗。該研究獲多家機構支持，相關論文已於11月初發布。

智啟未來，您的人工智能解決方案智庫