報道によると、開発者 JeecgBoot は Mac Studio M4Max 環境で Claude Code とローカルの大規模モデルとの連携を深くテストしました。その結果、コミュニティが魔改した蒸留版モデルを使用することで、公式バージョンに比べて生成速度が5〜6倍向上したことが確認されました。

image.png

テストの核心:モデルを選ぶことがチューニングより重要

今回のテストでは、体験が悪い公式バージョンを捨て、コミュニティが魔改したモデル gemma-4-26b-a4b-it-claude-opus-heretic-ara を採用し、驚くようなデータ性能を実現しました:

  • 極限の速度: 生成速度は78tok/sに達し、公式バージョンの数十tokenに比べて大幅に向上しています。

  • スパースなアクティブ化: A4B(Active4B)MoE アーキテクチャ を採用し、全体のパラメータ数は26Bですが、1回の推論時に約4Bのパラメータのみがアクティブになります。これにより「小パラメータの計算力、大パラメータの知能」を実現しています。

  • 超長文脈: 256K の文脈をサポートし、Anthropic API形式と完全に互換性があり、設定なしで接続可能です。

image.png

効率分析:Agenticワークチェーンは両刃の剣

テスト結果によると、モデルは非常に高速に生成するものの、具体的なタスク(例えば教師表コードの生成)を実行する際には、約1.5分

  • ボトルネックの特定: 耗時の主な原因は、Claude Code の複数ステップのAgentic意思決定チェーンです。システムは実行前に複数回のThought(思考)とSkillの読み込みを行っており、Prompt Tokenが膨らんでしまいます。

  • 価値のトレードオフ: この複数ステップの意思決定は、コード生成や修正などのタスクにおいて非常に価値があります。これは経路の規範と論理の閉環を保証しますが、単純な知識質問の場合には、LM Studioの会話機能を使って時間を節約することをお勧めします。

image.png

品質評価:JeecgBoot教師表出力

JeecgBootフレームワークを対象にしたテストでは、この組み合わせは非常に高い実戦的な水準を示しました:

  • 規範性: SQLのパスはFlywayの規則に自動的に合致し、日付の生成も正確です。

  • 技術スタック: Vue3ではscript setup + TSの書き方を採用しており、現代的な開発基準に完全に対応しています。

  • 完備性: Controller、Service、Mapperを含む一式の骨格を生成しています。

  • 欠点: 複雑なメソッド本体はまだ人手で補完する必要があります。重要な論理については、人手による再確認を推奨します。

戦略的提案:二つのモデルの「高低組み合わせ」

テスト結果に基づき、開発者はプライバシー、コスト、品質のバランスを取った最適な戦略を提案しました:

  1. ローカルの魔改モデル(80%のシナリオ): 日常的なCRUD生成、コード説明、およびプライバシーが敏感な内部プロジェクトを処理し、ゼロコストとネットワーク外でのデータ流出防止の安全性を享受します。

  2. クラウドの公式API(20%のシナリオ): 複雑なアーキテクチャ設計やコアセキュリティモジュールなどの高難度タスクに対応し、生産レベルの品質を確保します。

結論:ローカルAI開発の新時代を開く

強力なハードウェアであるM4Maxの普及に伴い、Q4_K_XL 量化技術と併せて、ローカルで高性能Agentを動作させることがもはやフィクションではなくなりました。QwenPawClaude Code