近日,思科公司發佈了一款新型路由器 ASIC,旨在幫助數據中心運營商克服電力和容量限制,將現有的數據中心連接成一個統一的計算集羣。這款名爲 Cisco8223的路由器具備51.2Tbps 的傳輸速度,採用了思科自主研發的 Silicon One P200ASIC。結合800Gbps 的相干光學技術,思科表示,該平臺可以支持最遠達1,000公里的連接。

數據中心 超級計算機 (2)

圖源備註:圖片由AI生成,圖片授權服務商Midjourney

通過連接足夠數量的路由器,思科稱該架構在理論上可以實現超過三艾字節每秒的總帶寬,足以連接當前最大的 AI 訓練集羣。這樣一個網絡甚至可以支持包含數百萬個 GPU 的多站點部署,但要實現這種級別的帶寬,成本將相當高昂,需使用數千個路由器。

對於那些不需要如此高速度的客戶,思科表示,這些路由器可以在較小的雙層網絡中支持高達13Tbps 的帶寬。這種高速度的跨數據中心網絡已引起多個大型雲服務提供商的關注,包括微軟和阿里巴巴。思科告訴我們,這些公司正在評估這些芯片的潛在部署。

阿里巴巴雲網絡基礎設施負責人蔡登思表示:“這款新的路由芯片將使我們能夠擴展到核心網絡,取代傳統的機架式路由器,使用一組 P200驅動的設備。這一轉變將顯著增強我們數據中心互聯網絡的穩定性、可靠性和可擴展性。”

思科並不是唯一一家加入分佈式數據中心行列的網絡供應商。今年早些時候,Nvidia 和 Broadcom 也推出了自己的跨數據中心網絡 ASIC。與 P200相似,Broadcom 的 Jericho4是一款51.2Tbps 的交換芯片,主要設計用於高速數據中心間的網絡架構。Broadcom 表示,這款芯片可以在超過100公里的距離內以超過100Tbps 的速度連接數據中心。

儘管這些交換和路由 ASIC 能夠幫助數據中心運營商克服電力和容量的限制,但延遲仍然是一個持續的挑戰。我們常常認爲光速是瞬時的,但其實並非如此。兩座位於1,000公里外的數據中心之間傳輸的數據包,單程大約需要五毫秒才能到達目的地,這還未考慮到傳輸信號過程中所需的額外延遲。

儘管如此,谷歌 DeepMind 團隊在今年早些時候發表的研究表明,通過在訓練過程中對模型進行壓縮,並在兩個數據中心之間進行戰略性通信調度,許多延遲問題是可以克服的。

劃重點:

🌐 新型 Cisco8223路由器具備51.2Tbps 傳輸速度,連接數據中心形成統一計算集羣。  

💡 可支持多達三艾字節每秒的帶寬,適合大型 AI 訓練需求。  

🚀 阿里巴巴等大型雲服務提供商正在考慮採用該技術,以提升網絡穩定性和可靠性。