インテルは2025年8月に「戦闘マトリクス」プロジェクトの最新ソフトウェアアップデートを発表し、インテルArc BシリーズGPUのAI推論サポートを最適化するLLM-Scaler1.0コンテナをリリースしました。
今年5月にはすでにインテルが「戦闘マトリクス」プロジェクトを発表しており、最大8つのインテルArc Pro GPUをAI推論にサポートし、SR-IOVサポートや改良されたvLLM性能などの新機能を提供することを目的としています。インテルの目標は、第3四半期中に製品の利用可能状態を実現し、年末までにすべての機能を完成させることです。
今回リリースされたLLM-Scaler1.0は、「Linux環境向けに設計された新しいコンテナーソリューションで、優れた推論性能を提供するために最適化されており、マルチGPU拡張とPCIeピアツーピアデータ転送をサポートしています。また、ECC、SR-IOV、モニタリングおよびリモートファームウェア更新などの企業向けの信頼性と管理性の特徴も備えています。」このバージョンのリリースでは、新たなvLLM性能最適化、さまざまな新規vLLM機能、そしてより良いマルチモーダルモデルサポートも統合されています。
LLM-Scaler1.0コンテナにはoneCCLベンチマークサポートとXPUマネージャーの統合が含まれており、さまざまなGPUモニタリング機能を便利に提供します。さらに、他の強化機能も更新されました。
インテルの公式ウェブサイトの公告によると、次段階ではより安定したLLM Scalerバージョンおよびその他の新機能をリリースする予定であり、第3四半期末までに完了する見込みです。完全な機能のリリースは計画通り第4四半期に行われる予定です。
ポイント:
🌟 インテルがLLM-Scaler1.0コンテナをリリースし、Arc BシリーズGPUのAI推論性能を最適化しました。
💻 新バージョンはマルチGPU拡張およびPCIeピアツーピアデータ転送をサポートし、企業向けの信頼性を強化しています。
📈 今後はより安定したバージョンと新機能をリリースし、第4四半期に完全なリリースを予定しています。