紅帽公司近日發佈了其企業級 Linux 人工智能平臺 RHEL AI 的最新版本1.3,該版本新增了對 IBM Granite 大型語言模型(LLM)的支持,並預覽了對 Intel Gaudi3加速器的支持。這一更新爲紅帽的服務合作伙伴和系統集成商帶來了更多的機會,幫助企業更有效地探索和整合人工智能應用。

image.png

紅帽 AI 業務部門副總裁兼總經理喬・費爾南德斯表示,服務合作伙伴和系統集成商在幫助公司實現不同的應用案例方面扮演着重要角色。他指出,生成式人工智能的複雜性使得這些合作伙伴能夠爲客戶提供更具成本效益的解決方案。紅帽旨在通過使用更小的模型來降低成本,簡化將模型與客戶數據和用例集成的複雜性,並提供靈活性,以便在混合環境中部署這些模型。

RHEL AI1.3版專爲企業應用開發、測試和運行生成式人工智能模型而設計。此次更新包括對 IBM 開源許可的 Granite 大語言模型的支持,同時還利用開源技術進行數據準備。用戶可以通過與 IBM 共同開發的 InstructLab 模型對齊項目,利用這些組件創建可打包的、可啓動的 RHEL 映像,以便在混合雲中進行單獨服務器的部署。

新版本支持 Granite3.08b 英文語言用例,並提供了開發者預覽,用戶可以體驗該模型的非英語語言、代碼生成和函數調用能力,後續版本將全面支持這些功能。此外,RHEL AI 還支持 IBM 研究院的 Docling 開源項目,能夠將常見文檔格式轉換爲 Markdown、JSON 等格式,以便用於生成式人工智能應用和訓練。新版本具備上下文感知的分塊能力,能夠考慮文檔的結構和語義元素,旨在提高生成式人工智能的響應質量。

此次發佈還增加了對 Intel Gaudi3加速器的技術預覽支持,用戶可以在實時處理中並行處理多個請求,並在處理過程中動態調整 LLM 參數。未來的 RHEL AI 版本將進一步支持 Docling 的更多文檔格式,集成增強檢索生成管道以及 InstructLab 知識調優功能。

劃重點:  

🔹 RHEL AI1.3版新增對 IBM Granite 大語言模型的支持,提升企業應用能力。  

🔹 新版本預覽了對 Intel Gaudi3加速器的支持,增強了實時處理能力。  

🔹 Red Hat 致力於降低人工智能模型的成本和複雜性,推動靈活的混合雲部署。