在3月18日的 GTC 大會上,Nvidia 首席執行官黃仁勳宣佈了一項令人奮的計劃,旨在通過新推出的軟件 Dynamo,將 DeepSeek 的人工智能處理速度提高30倍。此舉是 Nvidia 對 DeepSeek 公司 R1人工智能程序引發的市場動盪的迴應。DeepSeek 的技術能夠顯著降低每個查詢所需的計算量,導致投資者對 Nvidia 的未來前景表示擔憂。
Nvidia 的 Dynamo 軟件能夠將 AI 推理任務分配到多達1000個 GPU 上並行處理,極大地提升了查詢吞吐量。黃仁勳表示,使用新的 Blackwell 芯片,Dynamo 能夠在相同的架構下提供30倍的處理能力。這種能力的提升使得 AI 數據中心可以在每秒內處理更多的 tokens,從而提高整體收入。
具體來說,Dynamo 軟件能夠以每百萬個 tokens $1的價格,提升每秒的處理量。這意味着,服務提供商可以選擇同時處理更多客戶的查詢,或是爲單一用戶提供更強大的服務,從而收取更高的費用。Nvidia 稱這種高性能的 AI 服務爲 “AI 工廠”。
爲了進一步增強 DeepSeek 的性能,Nvidia 還在 HuggingFace 上發佈了經過調整的 DeepSeek R1版本。這一版本使用了更少的計算位數,即 “FP4”,從而在不顯著降低模型準確性的前提下,大幅提升了性能。
除了 Dynamo,Nvidia 還推出了最新版本的 Blackwell 芯片 “Ultra”,提升了內存容量和整體性能。此外,Nvidia 還正式發佈了供 AI 開發者使用的小型個人計算機 DGX Spark,並更新了 DGX Station 桌面計算機的配置。
在此次大會上,Nvidia 還展示了其他多項新產品和合作項目,包括改進的網絡交換機和適用於醫療機器人的軟件模型,展示了 Nvidia 在 AI 和計算領域的持續創新能力。
劃重點:
🌟 Nvidia 推出 Dynamo 軟件,將 DeepSeek AI 的處理速度提升30倍。
💰 通過 Dynamo,服務提供商能夠更高效地處理客戶查詢,提高收入。
🖥️ 新版 Blackwell 芯片 “Ultra” 和 DGX Spark 計算機也在大會上正式發佈。