Nvidia 發佈全新 Rubin CPX GPU，助力 “海量上下文” 人工智能應用

Nvidia 近日宣佈，其全新的 Vera Rubin 微架構正處於研發階段，計劃於2026年正式推出。該架構下的 Rubin CPX 變體將專注於滿足那些需要處理海量上下文窗口的人工智能工作負載。Nvidia 首席執行官黃仁勳在新聞發佈會上表示:“Vera Rubin 平臺將標誌着人工智能計算的新飛躍，推出下一代 Rubin GPU 和名爲 CPX 的新類別處理器。”

Rubin CPX 特別適用於需要處理超過一百萬個 token 的應用場景，例如複雜的軟件開發和高清晰度視頻生成。根據 Nvidia 的計劃，Vera Rubin NDL144CPX 類 GPU 將於2026年底上市。CPX 模型是針對需要長上下文窗口的應用而特別設計的，能夠提供8exaflops 的人工智能性能、30PF NVFP4的上下文計算能力，以及相較於 Nvidia GB300NVL72系統提升了三倍的指數運算能力。此外，CPX 模型還配備了128GB GDDR7內存、4個編碼器和4個解碼器，專爲生成視頻而設計，並提供100TB 的快速內存。

Nvidia 的高管表示，Vera Rubin NDL144CPX 可被視爲大型人工智能工廠的一部分。爲了支持大規模數據中心的構建，Nvidia 還計劃推出千兆規模的參考設計。這意味着，Nvidia 將與基礎設施公司密切合作，從計算的角度重新設計數據中心，以提供覆蓋建築、設計、模擬、運營等各個方面的參考設計。

在此次發佈前，Nvidia 還公佈了最新的 MLPerf 推理測試結果，黑威爾 GPU 在該基準測試中創下了新記錄，超越了 Llama3.1405B 交互模型的基線。此項創新技術被稱爲 “解耦服務”，能夠使相同硬件在性能上得到提升，這爲已經部署解決方案的企業帶來了額外的收入機會。

劃重點:
🔍 **Nvidia 發佈 Rubin CPX GPU，旨在支持海量上下文 AI 應用。**
🚀 ** 該 GPU 將於2026年底上市，具備強大的 AI 性能和內存配置。**
🏢 **Nvidia 計劃推出數據中心的千兆規模參考設計，助力 AI 工廠建設。**

微軟接手挪威數據中心，增購 3 萬塊英偉達芯片

微軟與挪威數據中心Nscale達成協議，租用其位於北極圈內的算力資源，該數據中心原爲OpenAI“星門計劃”準備。協議涉及額外租用3萬塊英偉達Vera Rubin芯片，擴展了微軟此前在該園區62億美元的投資計劃。OpenAI曾考慮在此合作支持AI項目。

英偉達正式發佈Rubin加速平臺:3nm工藝集成3360億晶體管，算力躍升五倍

英偉達在GTC2026大會上發佈下一代AI加速平臺“Vera Rubin”，以天文學家薇拉·魯賓命名，標誌着公司向全棧AI工廠基礎設施轉型。該平臺採用臺積電3納米制程，集成3360億晶體管，性能較前代提升超60%。其“六芯協同”架構重塑超算標準，超級芯片整合Vera CPU與雙Rubin GPU。

Nvidia 發佈全新 Rubin CPX GPU，助力 “海量上下文” 人工智能應用

相關推薦

微軟接手挪威數據中心，增購 3 萬塊英偉達芯片

英偉達正式發佈Rubin加速平臺:3nm工藝集成3360億晶體管，算力躍升五倍

CES 2026：黃仁勳與楊元慶聯手，揭祕“AI超級工廠”建設計劃

英偉達發佈全新“魯賓”架構：超級芯片 Vera Rubin 現身，AI 算力成本將大幅下降

Nvidia 推出新一代 Rubin 芯片架構，全面提升 AI 計算能力

​Nvidia 發佈全新 Rubin CPX GPU，助力 “海量上下文” 人工智能應用

相關推薦

微軟接手挪威數據中心，增購 3 萬塊英偉達芯片

英偉達正式發佈Rubin加速平臺:3nm工藝集成3360億晶體管，算力躍升五倍

​CES 2026：黃仁勳與楊元慶聯手，揭祕“AI超級工廠”建設計劃

英偉達發佈全新“魯賓”架構：超級芯片 Vera Rubin 現身，AI 算力成本將大幅下降

Nvidia 推出新一代 Rubin 芯片架構，全面提升 AI 計算能力

Nvidia 發佈全新 Rubin CPX GPU，助力 “海量上下文” 人工智能應用

CES 2026：黃仁勳與楊元慶聯手，揭祕“AI超級工廠”建設計劃