近日,戴爾在其 AI 工廠推出了全新的戴爾 AI 平臺,該平臺集成了英特爾最新的 Gaudi3AI 加速器,旨在爲企業簡化 AI 技術的採納、集成與擴展過程。這一經過全面驗證的端到端解決方案,結合了英特爾 Gaudi3硬件的強大性能、開源軟件的靈活性以及戴爾在企業基礎設施領域的豐富經驗,爲各行各業的 AI 轉型提供了便捷的解決路徑。
“與戴爾的合作,將英特爾 Gaudi3的強大能力帶入了企業部署的整合解決方案中。這一平臺優化了現代 AI 的需求,涵蓋從大語言模型到邊緣推理的多種應用,同時提供企業所需的靈活性和開放性,” 英特爾數據中心 AI 戰略與產品管理副總裁 Saurabh Kulkarni 表示。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
對於企業來說,AI 部署往往需要在高性能、可擴展性、靈活性和成本效益之間找到平衡。戴爾 AI 平臺的推出恰好解決了這一痛點,Gaudi3加速器提供了與 Nvidia H100相比,70% 的更佳性價比,尤其在 Llama380B 模型推理方面表現突出。此外,該平臺的可擴展架構能夠隨企業需求的變化而演進,確保 IT 專業人員在滿足日益增長的需求時不會失去靈活性。
在 AI 工作負載的支持方面,戴爾 AI 平臺的核心是優化過的 PowerEdge XE9680服務器。該服務器配備了八個英特爾 Gaudi3加速器,128GB 的高帶寬內存(HBM)和每秒3.7TB 的帶寬,非常適合處理大語言模型和計算機視覺任務。同時,它還配備了5代英特爾 Xeon 處理器,最多可支持64個核心,具備高效的複雜計算能力。
爲了加速開發者的工作,該平臺還集成了預驗證的開源軟件棧,支持 PyTorch、Hugging Face 等流行框架,並引入 Kubernetes 以實現靈活的資源調度和編排。此外,戴爾企業中心提供了一系列針對英特爾 Gaudi3優化的模型,幫助開發者快速實現應用。
戴爾 Omnia 作爲高性能集羣管理的開源工具,可以動態分配資源,使 IT 團隊和開發者能夠快速適應和優化不斷變化的工作負載。這一平臺通過與多種工具和框架的無縫集成,爲企業提供了可靠性與靈活性的完美結合。
想了解英特爾 Gaudi3AI 加速器的更多功能,歡迎在2025年5月19日至22日的戴爾科技世界大會上訪問英特爾展位654或戴爾展位833。