英特爾於2025年8月宣佈了其 “戰鬥矩陣” 項目的最新軟件更新,並推出了 LLM-Scaler1.0容器,以優化 Intel Arc B 系列顯卡的 AI 推理支持。
早在今年5月,英特爾就宣佈了 “戰鬥矩陣” 項目,旨在支持多達八塊 Intel Arc Pro GPU 用於 AI 推理,並提供 SR-IOV 支持、改進的 vLLM 性能等多項新功能。英特爾的目標是在第三季度實現產品可用性,並在年末前實現全面功能。
此次發佈的 LLM-Scaler1.0被描述爲 “一個專爲 Linux 環境構建的新容器化解決方案,優化以提供卓越的推理性能,支持多 GPU 擴展和 PCIe 點對點數據傳輸,並設計包括 ECC、SR-IOV、遙測及遠程固件更新等企業級的可靠性和可管理性特性。” 此版本的發佈還整合了新的 vLLM 性能優化、各種新 vLLM 功能,以及更好的多模態模型支持。
LLM-Scaler1.0容器還包含 oneCCL 基準支持和 XPU 管理器集成,爲各種 GPU 遙測功能提供了便利。此外,其他增強功能也得到了更新。
在英特爾官網的公告中,他們提到下一步將推出更爲穩固的 LLM Scaler 版本以及其他新功能,預計將在第三季度結束前完成。全面功能的發佈仍按計劃在第四季度進行。
劃重點:
🌟 英特爾發佈 LLM-Scaler1.0容器,優化 Arc B 系列顯卡的 AI 推理性能。
💻 新版本支持多 GPU 擴展和 PCIe 點對點數據傳輸,增強了企業級可靠性特性。
📈 未來將推出更穩固版本及新功能,計劃在第四季度全面發佈。