最近、IBM AIチームはGranite4.0Nanoシリーズをリリースしました。このシリーズはローカルおよびエッジでの推論に特化した小さなモデルのファミリーで、企業がより強力な制御能力和オープンソースライセンスを提供することを目的としています。このシリーズには8つのモデルが含まれており、350Mと約1Bの2つの規模に分かれています。混合SSMとトランスフォーマーのアーキテクチャを使用し、基本モードと指示モードの両方をサポートしています。すべてのモデルはApache2.0ライセンスで公開され、vLLM、llama.cpp、MLXなどの人気のある実行環境でネイティブに動作します。
Granite4.0Nanoシリーズには4つのモデルラインとそのベースバージョンが含まれます。その中でも、Granite4.0H1Bは混合SSMアーキテクチャを使用しており、パラメータ数は約1.5Bです。一方、Granite4.0H350Mも同様に混合方法を使用しており、パラメータ数は350Mです。最大限の実行時互換性を確保するため、IBMはGranite4.01BとGranite4.0350Mのトランスフォーマー版も提供しています。
これらのH変異体モデルは、SSMレイヤーとトランスフォーマーレイヤーを交互に使用する設計になっており、純粋なトランスフォーマーと比較してメモリ増加において顕著な利点があります。同時に、トランスフォーマーモジュールの汎用性を保持しています。Granite4.0Nanoモデルはデータパイプラインを削減していませんが、大規模なGranite4.0モデルと同じトレーニング方法に従っており、15兆以上のトークン以上を使用してトレーニングされており、指示調整によりツール使用や指示遵守能力が向上しています。

IBMはGranite4.0Nanoを他の同種モデルと比較し、Qwen、Gemma、LiquidAI LFMを含め、結果として一般知識、数学、コード、セキュリティなどの分野でGranite4.0Nanoの性能が大幅に向上していることが示されています。また、このシリーズのモデルは代理タスクにおいてIFEvalおよびバークレー関数呼び出しランキング第3版で優れた成績を収めています。
これらのモデルはISO42001認証を受け、暗号化された署名形式でリリースされ、企業向けの使用に必要な追跡可能性とガバナンス能力を確保しています。ユーザーはHugging FaceとIBM watsonx.aiからこれらのモデルにアクセスでき、エッジ、ローカル、ブラウザレベルでのデプロイメントが可能です。これにより、早期のAIエンジニアやソフトウェアチームがプロジェクトをよりよく実現できるようになります。
huggingface:https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models
ポイント:
🔹 IBMはGranite4.0Nanoシリーズをリリースし、エッジAI推論に適した8つのモデルを含んでいます。
🔹 このシリーズのモデルは15兆を超えるトークンでトレーニングされ、パフォーマンスの継承性が保証されています。
🔹 すべてのモデルはISO42001認証を受け、企業向けのガバナンス能力を備えており、さまざまな実行環境をサポートしています。
