據報道,開發者 JeecgBoot 在 Mac Studio M4Max 環境下,針對 Claude Code 對接本地大模型進行了深度實測。結果顯示,通過使用社區魔改蒸餾版模型,生成速度較官方原版實現了 5~6倍 的跨越式提升。

image.png

實測核心:選對模型比調優更重要

在本次測試中,開發者棄用了體驗欠佳的官方原版,轉而採用社區魔改模型 gemma-4-26b-a4b-it-claude-opus-heretic-ara,取得了驚豔的數據表現:

  • 極致速度: 生成速度高達 78tok/s,相比原版的十幾 token 提升顯著。

  • 稀疏激活: 採用 A4B(Active4B)MoE 架構,總參數26B 但每次推理僅激活約4B 參數,實現了“小參數算力、大參數智能”。

  • 超長上下文: 支持 256K 上下文,完美兼容 Anthropic API 格式,實現零配置對接。

image.png

效能分析:Agentic 工作鏈是雙刃劍

實測顯示,儘管模型生成極快,但在執行具體任務(如生成教師表代碼)時,總耗時仍需約 1.5分鐘

  • 瓶頸定位: 耗時主要集中在 Claude Code 的多步 Agentic 決策鏈。系統在執行前會進行多輪 Thought(思考)和 Skill 加載,導致 Prompt Token 膨脹。

  • 價值權衡: 這種多步決策對代碼生成和修改類任務極具價值,能確保路徑規範和邏輯閉環;但對於簡單的知識問答,建議直接使用 LM Studio 對話以節省時間。

image.png

質量評估:JeecgBoot 教師表輸出

在針對JeecgBoot框架的實測中,該組合展現了極高的實戰水準:

  • 規範性: SQL 路徑自動符合 Flyway 規範,日期生成準確。

  • 技術棧: Vue3採用 script setup + TS 寫法,完全符合現代開發標準。

  • 完整性: 生成了包括 Controller、Service、Mapper 在內的全套骨架。

  • 不足: 複雜方法體仍需人工補充,關鍵邏輯建議進行人工複覈。

戰略建議:雙模型“高低配”組合

基於實測數據,開發者提出了一套兼顧隱私、成本與質量的最優策略:

  1. 本地魔改模型(80% 場景): 處理日常 CRUD 生成、代碼解釋及隱私敏感的內部項目,享受零成本與數據不出內網的安全性。

  2. 雲端官方 API(20% 場景): 應對複雜架構設計、核心安全模塊等高難度任務,確保生產級質量。

結語:開啓本地化 AI 開發新常態

隨着 M4Max 等強力硬件的普及,配合 Q4_K_XL 量化 技術,本地運行高性能 Agent 已不再是科幻。QwenPawClaude Code 的本地化實踐,正爲企業開發者在保障數據隱私的同時,提供了前所未有的生產力工具。