根據《金融時報》的報道,Oracle 公司將花費約400億美元購買 Nvidia 最新超級芯片,計劃爲 OpenAI 提供計算能力。這些超級芯片將部署在位於德克薩斯州阿比林的首個美國 “星門” 數據中心。不過,該數據中心能否提供足夠的電力以滿足如此龐大的計算需求,仍然存在疑問。

GPU 芯片 (1)

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

這筆鉅額投資將用於購買約40萬個 Nvidia GB200超級芯片。該芯片在 Nvidia 的 GTC 活動中首次發佈,配備了一對強大的 Blackwell GPU 和自家的 Grace CPU。36個 GB200組成一個 NVL72系統,能夠提供每秒1.4exaFLOPS 的稀疏 FP4計算能力。若按此計算,Oracle 將在1.2吉瓦的設施內部署約11,000個機架系統,整體計算能力將達到近16zettaFLOPs。

每個 NVL72機架的最大功耗爲120千瓦,若考慮電力和冷卻損耗,估算需要約1.45吉瓦的電力才能充分利用這些超級芯片的潛力。然而,該數據中心今年僅能提供約200兆瓦的電力,這足以支撐約1,500個 NVL72機架,約54,000個 GB200超級芯片。剩餘的電力預計將在2026年前投入使用,Oracle 計劃租用該場地15年。

儘管電力問題可能是一個挑戰,但 Oracle 與數據中心運營商 Crusoe 仍可能找到解決方案。並非所有的機架系統都會在同一時間達到最大功耗。考慮到阿比林校園由八棟建築組成,Oracle 不太可能將所有的超級芯片集中在一個訓練集羣中。我們預計,部分芯片將用於推理、合成數據生成、強化學習等其他工作負載,這些工作負載不太可能使系統達到極限。

如果 Oracle 和 Crusoe 能夠克服電力限制,阿比林數據中心將成爲美國最強大的 AI 超級計算機之一,其計算能力比埃隆・馬斯克的 Colossus 超級計算機多出10至20倍。位於田納西州的 Colossus 系統配備了近800exaFLOPS 的稀疏 FP8計算能力,目前僅有一個供電站完成,部分供電仍依賴於多臺天然氣渦輪機。

此外,OpenAI 的 “星門” 項目還將國際化,與 Oracle、Nvidia、Cisco 等公司合作,在阿聯酋建立新的計算能力。該項目預計在2026年上線首個200兆瓦的電力階段。

劃重點:

🌟 Oracle 將投資400億美元購買40萬個 Nvidia GB200超級芯片,助力 OpenAI。  

⚡ 阿比林數據中心可能面臨電力不足的挑戰,目前僅有200兆瓦的電力可用。  

🌍 OpenAI 的 “星門” 項目正在國際擴展,計劃在阿聯酋建立更多計算能力。