在 GTC2025大會上,英偉達正式官宣其下一代人工智能(AI)芯片平臺,並命名爲「Vera Rubin」,致敬美國著名天文學家薇拉·魯賓(Vera Rubin),延續了英偉達以科學家名字命名架構的傳統。該系列的首款產品 Vera Rubin NVL144預計將於2026年下半年發佈。

英偉達首席執行官黃仁勳表示,Rubin 的性能將達到當前 Hopper 架構的900倍,相較之下,最新的 Blackwell 架構已經實現了對 Hopper68倍的性能提升,預示着 Rubin 將帶來又一次巨大的算力飛躍。

QQ20250319-095910.png

根據官方公佈的信息,Vera Rubin NVL144在 FP4精度下的推理算力高達3.6ExaFLOPS,在 FP8精度下的訓練性能爲1.2ExaFLOPS。與 GB300NVL72相比,性能提升了3.3倍。Rubin 將搭載最新的 HBM4顯存,帶寬達到驚人的13TB/s,並配備75TB 的快速內存,是上一代的1.6倍。在互聯方面,Rubin 支持 NVLink6和 CX9,帶寬分別達到260TB/s 和28.8TB/s,均爲前代的兩倍。

標準版的 Rubin 芯片將配備 HBM4顯存,其整體性能將遠超當前的旗艦級 Hopper H100芯片。

值得一提的是,Rubin 平臺還將引入名爲 Veru 的全新 CPU,作爲 Grace CPU 的繼任者。Veru 包含88個定製的 Arm 核心,每個核心支持176個線程,並通過 NVLink-C2C 實現高達1.8TB/s 的高帶寬連接。英偉達表示,定製的 Vera CPU 的速度將比去年 Grace Blackwell 芯片中使用的 CPU 提升一倍。

QQ20250319-095918.png

與 Vera CPU 搭配使用時,Rubin 在推理任務中的算力可達50petaflops,是 Blackwell20petaflops 的兩倍以上。此外,Rubin 還將支持高達288GB 的 HBM4內存,這對於需要處理大型 AI 模型的開發者來說至關重要。

與 Blackwell 類似,Rubin 實際上由兩個 GPU 組成,通過先進的封裝技術整合爲一個整體運行,進一步提升了整體的計算效率和性能。Rubin 的發佈無疑再次展現了英偉達在 AI 芯片領域的強大創新能力和對未來算力需求的深刻洞察。