隨着AI Agent的快速發展,讓大模型直接操控專業軟件(如圖像編輯、3D建模、辦公套件等)已成爲開發者社區的痛點。傳統的UI自動化方案容易崩潰,手動編寫腳本對接又耗時費力。香港大學數據智能實驗室(HKUDS)近日推出開源項目CLI-Anything,徹底顛覆這一現狀:只需一條命令,就能將任意軟件轉化爲AI Agent可直接調用的結構化命令行工具,真正實現“Agent-Native”軟件生態。

核心創新:自動化生成CLI,讓軟件“聽懂”AI指令
CLI-Anything採用全自動7階段流水線(分析源碼 → 架構設計 → 實現Click CLI → 測試規劃 → 測試編寫 → 文檔生成 → 發佈Python包),從軟件源碼或倉庫出發,自動構建生產級命令行接口。生成的CLI具備以下關鍵特性:
- 結構化與可組合:命令文本完美匹配大模型輸入,支持鏈式調用複雜工作流;
- JSON原生輸出:所有命令支持--json標誌,便於AI解析,避免複雜後處理;
- 自我描述:標準--help提供自動文檔,Agent可自行發現功能;
- 交互REPL模式:統一終端交互界面,支持歷史記錄與進度顯示;
- 高可靠性:已覆蓋1588+項測試(包括單元測試與端到端測試),全部通過。
不同於脆弱的GUI自動化或RPA方案,CLI-Anything直接調用軟件真實後端(如Blender渲染引擎、LibreOffice文件處理),生成標準項目文件(SVG、ODF、MLT XML等),確保功能完整且確定性強。
已支持軟件矩陣持續擴展
項目目前已爲13款主流開源/專業軟件生成完整CLI支持,包括:
- GIMP(圖像編輯)
- Blender(3D建模)
- Inkscape(矢量圖形)
- Audacity(音頻製作)
- LibreOffice(辦公套件)
- OBS Studio(直播錄製)
- Kdenlive / Shotcut(視頻剪輯)
- Zoom(視頻會議)
- Draw.io / Mermaid(圖表繪製)
- ComfyUI(AI圖像生成)等。
團隊表示,未來將覆蓋更多領域,如CAD、DAW、IDE、科學計算工具等,並歡迎社區貢獻自定義軟件的CLI封裝。
安裝與接入極簡,一鍵接入主流Agent框架
安裝門檻極低,尤其針對Claude Code用戶:
通過插件市場直接添加:
/plugin marketplace add HKUDS/CLI-Anything
/plugin install cli-anything
隨後即可運行:
/cli-anything <軟件路徑或倉庫>
項目還支持OpenClaw(通過SKILL.md技能文件)、OpenCode、Codex、Qodercli等多種Agent框架的無縫集成。全程本地運行,無需雲端依賴或複雜配置。
社區反響熱烈,GitHub星標已破1.7萬
自開源以來,CLI-Anything迅速登上GitHub趨勢榜,短短時間內收穫數萬星標。開發者們紛紛表示,這不僅是工具,更是通向“Agent操控一切軟件”未來的關鍵基礎設施。許多人已開始嘗試將其接入個人工作流,實現AI自動批量處理圖像、渲染3D模型、編輯視頻等場景。
項目地址:https://github.com/HKUDS/CLI-Anything
AIbase點評:CLI-Anything的出現,讓“軟件爲人服務”向“軟件爲Agent服務”邁出堅實一步。它避開了UI自動化的所有坑,用最古老卻最可靠的CLI形式,重新激活人類積累幾十年的軟件資產。對於AI Agent開發者、自動化愛好者和生產力工具追求者而言,這個項目值得立即 star 並深入研究。未來,誰先掌握“Agent-Native”接口,誰就掌握下一代生產力鑰匙。
