ローカルの推論が大進化！Claude Code が改造版 Gemma 4 と接続：速度が5倍に向上　CRUD開発の強力なツール

報道によると、開発者 JeecgBoot は Mac Studio M4Max 環境で Claude Code とローカルの大規模モデルとの連携を深くテストしました。その結果、コミュニティが魔改した蒸留版モデルを使用することで、公式バージョンに比べて生成速度が5〜6倍向上したことが確認されました。

テストの核心：モデルを選ぶことがチューニングより重要

今回のテストでは、体験が悪い公式バージョンを捨て、コミュニティが魔改したモデル gemma-4-26b-a4b-it-claude-opus-heretic-ara を採用し、驚くようなデータ性能を実現しました:

極限の速度: 生成速度は78tok/sに達し、公式バージョンの数十tokenに比べて大幅に向上しています。
スパースなアクティブ化: A4B（Active4B）MoE アーキテクチャ を採用し、全体のパラメータ数は26Bですが、1回の推論時に約4Bのパラメータのみがアクティブになります。これにより「小パラメータの計算力、大パラメータの知能」を実現しています。
超長文脈: 256K の文脈をサポートし、Anthropic API形式と完全に互換性があり、設定なしで接続可能です。

効率分析:Agenticワークチェーンは両刃の剣

テスト結果によると、モデルは非常に高速に生成するものの、具体的なタスク（例えば教師表コードの生成）を実行する際には、約1.5分

ボトルネックの特定: 耗時の主な原因は、Claude Code の複数ステップのAgentic意思決定チェーンです。システムは実行前に複数回のThought（思考）とSkillの読み込みを行っており、Prompt Tokenが膨らんでしまいます。
価値のトレードオフ: この複数ステップの意思決定は、コード生成や修正などのタスクにおいて非常に価値があります。これは経路の規範と論理の閉環を保証しますが、単純な知識質問の場合には、LM Studioの会話機能を使って時間を節約することをお勧めします。

品質評価:JeecgBoot教師表出力

JeecgBootフレームワークを対象にしたテストでは、この組み合わせは非常に高い実戦的な水準を示しました:

規範性: SQLのパスはFlywayの規則に自動的に合致し、日付の生成も正確です。
技術スタック: Vue3ではscript setup + TSの書き方を採用しており、現代的な開発基準に完全に対応しています。
完備性: Controller、Service、Mapperを含む一式の骨格を生成しています。
欠点: 複雑なメソッド本体はまだ人手で補完する必要があります。重要な論理については、人手による再確認を推奨します。

戦略的提案:二つのモデルの「高低組み合わせ」

テスト結果に基づき、開発者はプライバシー、コスト、品質のバランスを取った最適な戦略を提案しました:

ローカルの魔改モデル（80％のシナリオ）: 日常的なCRUD生成、コード説明、およびプライバシーが敏感な内部プロジェクトを処理し、ゼロコストとネットワーク外でのデータ流出防止の安全性を享受します。
クラウドの公式API（20％のシナリオ）: 複雑なアーキテクチャ設計やコアセキュリティモジュールなどの高難度タスクに対応し、生産レベルの品質を確保します。

結論：ローカルAI開発の新時代を開く

強力なハードウェアであるM4Maxの普及に伴い、Q4_K_XL 量化技術と併せて、ローカルで高性能Agentを動作させることがもはやフィクションではなくなりました。QwenPawとClaude Code

ローカルの推論が大進化！Claude Code が改造版 Gemma 4 と接続：速度が5倍に向上　CRUD開発の強力なツール

テストの核心：モデルを選ぶことがチューニングより重要

効率分析:Agenticワークチェーンは両刃の剣

品質評価:JeecgBoot教師表出力

戦略的提案:二つのモデルの「高低組み合わせ」

関連推奨

Kimi K3の攻防試験問題でトラブル：脆弱性の利用は米国の先端モデルの40％にとどまるクラスティメーションの疑いが保安機関によって公にされる

ランウェイがMedia Routerをリリース：AIモデルを自動切替してTokenを節約。クリエイティブな検証から完成作品まで一貫して対応

小鹏の人形ロボットが広州工場で小規模な試験生産を開始、2026年に量産を予定

快手がAIインタラクティブコンテンツ分野に参入、初回のクリエイター募集を開始

グーグル Q2 の資本支出が倍増し記録を更新：449億ドルをAIインフラに投資、クラウド事業の利益率はほぼ倍増

ローカルの推論が大進化！Claude Code が改造版 Gemma 4 と接続：速度が5倍に向上 CRUD開発の強力なツール

テストの核心：モデルを選ぶことがチューニングより重要

効率分析:Agenticワークチェーンは両刃の剣

品質評価:JeecgBoot教師表出力

戦略的提案:二つのモデルの「高低組み合わせ」

関連推奨

Kimi K3の攻防試験問題でトラブル：脆弱性の利用は米国の先端モデルの40％にとどまる クラスティメーションの疑いが保安機関によって公にされる

ランウェイがMedia Routerをリリース：AIモデルを自動切替してTokenを節約。クリエイティブな検証から完成作品まで一貫して対応

小鹏の人形ロボットが広州工場で小規模な試験生産を開始、2026年に量産を予定

快手がAIインタラクティブコンテンツ分野に参入、初回のクリエイター募集を開始

グーグル Q2 の資本支出が倍増し記録を更新：449億ドルをAIインフラに投資、クラウド事業の利益率はほぼ倍増

ローカルの推論が大進化！Claude Code が改造版 Gemma 4 と接続：速度が5倍に向上　CRUD開発の強力なツール

Kimi K3の攻防試験問題でトラブル：脆弱性の利用は米国の先端モデルの40％にとどまるクラスティメーションの疑いが保安機関によって公にされる