Anthropic 的研究员 Nicholas Carlini 在其最新博文中分享了一个激动人心的实验:16 个 Claude Opus 4.6 智能体在几乎无需人类干预的情况下,仅用两周的时间便合作编写了约 10 万行的 Rust 代码,成功构建了一个功能完备的 C 语言编译器。

这一成果的背后,是 Carlini 利用智能体团队(Agent Teams)功能部署的 16 个 Claude 模型实例。整个项目几乎在零监督的环境下进行,团队通过约 2000 次代码会话,从零开始,逐步搭建起这个编译器。值得注意的是,这些 AI 智能体都是在独立的 Docker 容器中运行,它们共同克隆了一个共享的 Git 代码仓库,形成了高效的协作机制。

项目的实现成本约为 2 万美元(折合人民币约 13.9 万元),而最终的成果不仅包括了可启动的 Linux 6.9 内核,还能支持 x86、ARM 和 RISC-V 架构。此外,该编译器还成功编译了 PostgreSQL、SQLite、Redis 和 FFmpeg 等主流开源项目。在 GCC 压力测试套件的评估中,这款编译器的通过率高达 99%。更让人惊喜的是,它甚至能够成功编译并运行经典游戏《毁灭战士》(Doom)。

此次实验的一个亮点是,系统中并未设立专门负责调度的 “编排智能体”。每个 AI 实例像独立开发者一样,自主识别当前的紧迫任务,通过写入锁文件领取任务,并将完成的代码推送到上游。当出现代码合并冲突时,这些智能体也能自主协商解决,展示了出色的协作能力。

Anthropic 目前已在 GitHub 上将该项目开源,标志着 AI 协作编程的一个新里程碑。这项技术不仅为编程领域带来了新的可能性,也为未来的 AI 发展提供了宝贵的实践经验。