Microsoft AIは、大規模なシステムコードやコミット履歴を処理するための新しい深層研究支援ツール「Code Researcher」を発表しました。

この革新的なツールは、複雑なシステムコード(例: Linuxカーネル)でのデバッグとクラッシュ修正の課題に取り組むことを目的としており、ソフトウェア開発におけるAIのさらなる重要な進展を示しています。AIbaseによると、Code Researcherは複数ステップの推論と意味解析を通じて、システム級ソフトウェアの保守効率と正確性を大幅に向上させています。

image.png

Code Researcherの主要機能

Code Researcherは、大規模言語モデル(LLM)に基づいた自律エージェントで、コードリポジトリやコミット履歴を詳細に分析することが可能です。従来のコーディングツールとは異なり、意味解析、パターン認識、過去のコミットデータを総合的に処理することで、システムクラッシュの根本原因を自動的に追跡し、修正パッチを生成することができます。kBenchSyzベンチマークでのLinuxカーネルクラッシュ対応において、Code Researcherは解決率58%を達成し、SWE-agentの37.5%を大きく上回りました。さらに、Code Researcherは平均して10個の関連ファイルを探索しますが、SWE-agentはわずか1.33個であり、その深層的なコードリポジトリの探索能力が際立ちます。

幅広い適用範囲と実用性

Linuxカーネルだけでなく、オープンソースのマルチメディアソフトウェアでのテストでもCode Researcherは優れた汎用性を発揮しました。多面的な推論と全体的なコンテキスト収集により、さまざまな大規模コードリポジトリに対して高品質なクラッシュ修正提案を提供できます。これにより、開発者の手動デバッグの負担を軽減し、企業レベルのソフトウェア保守にもより効率的な解決策をもたらします。Microsoft AIによれば、このツールの導入により、システムレベルのソフトウェア開発の自動化が進められ、開発者にとって貴重な時間を節約できるでしょう。

Microsoft AIのCode Researcherは、技術的な革新だけでなく、AIがソフトウェア開発分野で持つ可能性を証明するものでもあります。AIエージェント技術の進化に伴い、Code Researcherのようなツールは人工知能一般(AGI)への道をさらに近づけます。AIbaseは、このツールの登場が開発者に強力な支援を提供し、業界全体にAI主導の開発新基準を樹立したと評価しています。

論文: https://www.microsoft.com/en-us/research/publication/code-researcher-deep-research-agent-for-large-systems-code-and-commit-history/