在最近的財報會議上,Broadcom 的 CEO Hock Tan 透露,該公司在前一季度收到了來自 Anthropic 的100億美元訂單,專門用於提供谷歌最新的張量處理單元(TPU)。此外,Tan 表示,在第四季度又獲得了來自同一客戶的110億美元訂單,預計將在2026年底交付。這使得 Anthropic 總共訂購了價值210億美元的 TPU。

Broadcom 還透露,目前公司在人工智能產品訂單方面積累了730億美元的待交付訂單,預計將在未來六個季度內發貨。TPU 是谷歌開發的專門用於人工智能工作負載的加速器。現在已經進入第七代,TPU 不僅可通過谷歌雲提供給客戶,還爲谷歌內部系統的訓練和部署提供支持,包括 Gemini 系列模型的相關任務。谷歌負責 TPU 的架構設計,而 Broadcom 則將這些設計轉化爲可製造的硅片,並負責大規模生產。這一合作關係與谷歌一貫的戰略相吻合,旨在控制關鍵的 AI 硬件設計,同時依賴半導體合作伙伴的製造專業知識。

作爲 TPU 的長期用戶,Anthropic 計劃大規模擴展其基礎設施,計劃在2026年前部署100萬個 TPU,配合超過一吉瓦的新計算能力。這將成爲業內最大規模的專用 AI 計算建設之一。

除了 Anthropic,許多其他公司也確認使用 TPU,包括 Meta、Cohere、Apple 以及 Ilya Sutskever 的新創業公司 Super Safe Intelligence(SSI)。據《信息》報道,Meta 正在評估從2027年起在其數據中心部署 TPU。

TPU 的廣泛應用源於其高效的能耗和針對 AI 訓練與推理的優化性能,逐漸對 NVIDIA 的 GPU 市場份額形成競爭壓力。Broadcom 表示,目前它的 TPU/XPU(定製 AI 加速器)客戶已達到五家,儘管尚未完全公開其客戶名單,但包括谷歌和 Anthropic 在內的客戶已經得到了確認。

根據 SemiAnalysis 的最新分析,TPU v7的峯值浮點運算性能(FLOPs)和內存帶寬比 NVIDIA 的 GB200平臺低約10%,但其整體擁有成本(TCO)表現更爲出色。SemiAnalysis 估計,谷歌內部部署 Ironwood 的成本比部署等效的 NVIDIA 系統低44%。即使對外客戶報價,TPU v7的 TCO 也比 NVIDIA 的 GB200低約30%,而比即將推出的 GB300低約41%。該分析指出,如果 Anthropic 在 TPU 上實現約40% 的機器利用率,TPU 的有效訓練成本每 FLOP 可能比 GB300級別的 GPU 集羣低50% 至60%。

劃重點:

🌟 Broadcom 與 Anthropic 簽署了210億美元的 TPU 訂單,助力其 AI 基礎設施的擴展。  

💡 TPU 被廣泛應用於多家科技公司,因其高效能和對 AI 任務的優化而逐漸挑戰 NVIDIA 的 GPU 市場。  

📉 TPU 的總體擁有成本低於 NVIDIA 的同類產品,顯示出其在 AI 計算領域的競爭優勢。