近日,OpenAI工程師 Ryan Lopopolo 通過長文 《Harness engineering》 揭開了內部團隊使用Codex的重度玩法。這場實驗不僅產出了名爲 Symphony 的“幽靈庫”,更定義了一種全新的工程工作方式。

核心實驗:給自己戴上“零人工寫碼”的鐐銬

Ryan 在實驗之初給自己設下了一個誇張的限制:絕對不親手寫任何代碼

從痛苦到爆發: 實驗初期,由於模型難以處理複雜邏輯,開發速度僅爲人工的十分之一。

倒逼工具進化: 爲了讓 Agent 獨立完工,團隊被迫開發出一套極其精細的Harness(開發臺)體系。

指數級增效: 隨着GPT-5.4等推理模型的迭代,這套系統的產出效率最終遠超任何單一工程師團隊。

關鍵戰術:把構建時間死守在“一分鐘”

OpenAI內部,Agent 的高效運行依賴於極致的反饋速度:

內部循環(Inner Loop): 團隊通過不斷重做構建系統(從 Makefile 到 Bazel 再到 Nx),確保構建時間嚴格控制在 1分鐘 以內。

邏輯拆解: 如果構建變慢,Agent 會自動將構建圖譜拆解得更細,直到複雜度降至閾值以下,以維持 Agent 的“專注力”。

範式轉移:人變成了 PR Review 的瓶頸

當代碼可以被極其容易地並行化時,真正稀缺的是“人類注意力”。

合併後評審: 團隊不再在合併前進行冗長的人工 Review,而是將其自動化,大部分人工 Review 發生在代碼合併之後,用於抽查質量和沉澱經驗。

可觀測性賦能: 工程師的工作不再是修 Bug,而是爲 Agent 提供Traces(追蹤)和可觀測性工具,讓 Agent 具備“自愈”能力。

經驗“蒸餾”:資深工程師腦子裏的“隱性經驗”寫進 Skill 文檔和測試中,將其固化爲系統上下文。

行業未來:“幽靈庫”與依賴內部化

Ryan 提出了一個極具衝擊力的觀點:隨着 Token 成本趨近於零,軟件依賴可能會逐漸消失。

Ghost Libraries(幽靈庫): 開發者只需定義一份高保真 Spec(規格),讓 Agent 在本地重新組裝實現。

依賴內部化: 對於中低複雜度的第三方庫,Agent 可以直接重寫並內聯到倉庫中,剝離無用代碼,打造完全自控的技術棧。

結語:從“副駕駛”到“獨立隊友”

OpenAI Frontier 團隊 的視野裏,未來的軟件開發不再是圍繞人的習慣優化工作流,而是圍繞 Agent 的可讀性 重構整個代碼庫。當 Agent 能夠自主處理從代碼編寫、CI 部署到生產監控的全鏈路任務,人類工程師的角色將徹底轉向系統架構的“牧羊人”。