Microsoft AI重磅發佈了一款名爲Code Researcher的深度研究代理工具,專爲處理大型系統代碼和提交歷史而設計。

這一創新工具旨在應對複雜系統代碼(如Linux內核)中調試和修復崩潰的挑戰,標誌着AI在軟件開發領域的又一次重大突破。AIbase從最新公開信息中獲悉,Code Researcher通過多步驟推理和語義分析,顯著提升了系統級軟件維護的效率和準確性。

image.png

Code Researcher的核心能力

Code Researcher是一款基於大型語言模型(LLM)的自主代理,具備深入分析代碼庫和提交歷史的能力。與傳統編碼工具不同,它能夠通過語義分析、模式識別和歷史提交數據的綜合處理,自動追蹤系統崩潰的根本原因並生成修復補丁。在針對Linux內核崩潰的kBenchSyz基準測試中,Code Researcher表現搶眼,崩潰解決率高達58%,遠超SWE-agent的37.5%。此外,Code Researcher平均能探索10個相關文件,而SWE-agent僅爲1.33個,凸顯了其深度探索代碼庫的強大能力。

廣泛適用性與實際應用

除了Linux內核,Code Researcher還在開源多媒體軟件的測試中展現了出色的通用性。通過多方面的推理和全局上下文收集,Code Researcher能夠爲各種大型代碼庫提供高質量的崩潰修復方案。這不僅減輕了開發者的手動調試負擔,還爲企業級軟件維護提供了更高效的解決方案。Microsoft AI表示,這一工具的推出將推動系統級軟件開發的自動化進程,爲開發者節省寶貴時間。

Microsoft AI的Code Researcher不僅是技術上的突破,也是對AI在軟件開發領域潛力的有力證明。隨着AI代理技術的發展,類似Code Researcher的工具正將我們帶向人工通用智能(AGI)更近一步。AIbase認爲,這款工具的問世不僅爲開發者提供了強大助力,也爲整個行業樹立了AI驅動開發的新標杆。

論文:https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/