Nvidia 近日宣佈,其全新的 Vera Rubin 微架構正處於研發階段,計劃於2026年正式推出。該架構下的 Rubin CPX 變體將專注於滿足那些需要處理海量上下文窗口的人工智能工作負載。Nvidia 首席執行官黃仁勳在新聞發佈會上表示:“Vera Rubin 平臺將標誌着人工智能計算的新飛躍,推出下一代 Rubin GPU 和名爲 CPX 的新類別處理器。”

Rubin CPX 特別適用於需要處理超過一百萬個 token 的應用場景,例如複雜的軟件開發和高清晰度視頻生成。根據 Nvidia 的計劃,Vera Rubin NDL144CPX 類 GPU 將於2026年底上市。CPX 模型是針對需要長上下文窗口的應用而特別設計的,能夠提供8exaflops 的人工智能性能、30PF NVFP4的上下文計算能力,以及相較於 Nvidia GB300NVL72系統提升了三倍的指數運算能力。此外,CPX 模型還配備了128GB GDDR7內存、4個編碼器和4個解碼器,專爲生成視頻而設計,並提供100TB 的快速內存。

Nvidia 的高管表示,Vera Rubin NDL144CPX 可被視爲大型人工智能工廠的一部分。爲了支持大規模數據中心的構建,Nvidia 還計劃推出千兆規模的參考設計。這意味着,Nvidia 將與基礎設施公司密切合作,從計算的角度重新設計數據中心,以提供覆蓋建築、設計、模擬、運營等各個方面的參考設計。

在此次發佈前,Nvidia 還公佈了最新的 MLPerf 推理測試結果,黑威爾 GPU 在該基準測試中創下了新記錄,超越了 Llama3.1405B 交互模型的基線。此項創新技術被稱爲 “解耦服務”,能夠使相同硬件在性能上得到提升,這爲已經部署解決方案的企業帶來了額外的收入機會。

劃重點:  

🔍 **Nvidia 發佈 Rubin CPX GPU,旨在支持海量上下文 AI 應用。**  

🚀 ** 該 GPU 將於2026年底上市,具備強大的 AI 性能和內存配置。**  

🏢 **Nvidia 計劃推出數據中心的千兆規模參考設計,助力 AI 工廠建設。**