このほど、AMDとクアルコムは、自社のハードウェアがOpenAIがリリースしたgpt-ossシリーズのオープン推論モデルを正式にサポートすることを発表しました。これはエッジコンピューティングとAIの統合において重要な一歩となるものです。OpenAIが新たにリリースしたgpt-ossシリーズには、パラメータ数が少ないgpt-oss-20bとより複雑なgpt-oss-120bの2つのモデルが含まれています。前者は16GBのメモリを搭載したデバイスでスムーズに動作し、後者は80GBのグラフィックメモリを備えた単一のGPUで効率的に実行できます。

AMDは、Ryzen AI Max+395プロセッサが世界初のgpt-oss-120bモデルを実行できるコンシューマー向けAI PCプロセッサであることを誇りに思っています。この強力なモデルに対応するために、AMDはGGMLフレームワークとMXFP4フォーマットを使用し、約61GBのVRAMを用いてgpt-oss-120bをスムーズに動作させました。また、「Strix Halo」プラットフォームは128GBの統一メモリを持ち、そのうち96GBをGPUに割り当てることで、実行要件を満たしています。

image.png

性能面では、Ryzen AI Max+395はgpt-oss-120bを実行する際、1秒あたり30トークンの出力速度を達成でき、MCPモデルの文脈プロトコルをサポートしています。これにより、ユーザーは複雑なタスクを処理する際、より速い応答性と高い効率を享受できます。

クアルコムは、初期テストの結果、gpt-oss-20bモデルがSnapdragonプラットフォームで優れた思考チェーン推論能力を示していると述べました。開発者はHugging FaceやOllamaなどの有名なプラットフォームを通じて、Snapdragonチップを搭載したデバイスでこのモデルに簡単にアクセスでき、その強大な機能を最大限に活かすことができます。

image.png

この協力は、AMDとクアルコムがAI分野における前向きな視点を持っていることを示しており、エッジコンピューティングと人工知能の未来の発展を切り開くことになりました。gpt-ossモデルが広範囲に利用されるにつれて、よりスマートなデバイスやより柔軟なAIアプリケーションの場面が期待されます。