最近、マイクロソフトは、今後の人工知能モデルのトレーニング需要に対応するため、大陸をまたぐデータセンターセンターのスーパークラスタを建設していることを発表しました。これらの新しい施設は複数のデータセンターを接続し、高速ネットワークを通じてデータを効率的に送信することを目的としており、最大で何百万億個のパラメータを持つAIモデルのトレーニングをサポートすることを目指しています。

10月、マイクロソフトはウィスコンシン州のマウント・プリメントデータセンターキャンパスで最初のノードを開始し、ジョージア州アトランタの施設に接続しました。これらのデータセンターは通常の施設ではなく、マイクロソフトが「フェアウォーター」クラスターと呼ぶものです。2階建ての建物で、チップ直結の液体冷却技術を使用しており、ほぼ水資源を消費しません。将来的には、マイクロソフトはこれらのクラスターを数十万台の多様なGPUに拡張し、さまざまなワークロードのニーズに対応する予定です。

相互接続されたデータセンターにより、マイクロソフトはより大規模なモデルをトレーニングでき、土地コストが低く、気候が良く、電力資源が豊富な地域に新しい施設を建設することができます。マイクロソフトは、この2つのデータセンターを接続するために使用される具体的な技術についてはまだ明らかにしていませんが、業界ではいくつかの選択肢があります。Ciscoの51.2TbpsルーターおよびBroadcomの新製品Jericho4ハードウェアなどが含まれており、これらは1000キロメートル離れたデータセンターを効果的に接続できる可能性があります。

一方、NVIDIAもAIトレーニングのニーズに対応するためのネットワーク技術の発展を積極的に推進しています。マイクロソフトは高性能コンピューティング環境において一般的にNVIDIAのInfiniBandネットワークプロトコルを使用しており、効率的なデータ転送への取り組みを示しています。AIワークロードの配布において、帯域幅や遅延の問題を減らすことは依然として研究者たちが注目しているテーマです。

AI分野での進展は顕著です。以前、グーグルのDeepMindチームは、トレーニング中にモデルを圧縮し、データセンター間の通信を適切に配置することで、多くの課題を克服できることを示すレポートを発表しました。

ポイント:

🌐 マイクロソフトは、将来の大規模なAIモデルのトレーニングをサポートするために、大陸をまたぐデータセンターセンターのスーパークラスタを構築しています。

💧 新しい施設は、効率的な液体冷却技術を使用しており、ほぼ水資源を消費しません。

🚀 さまざまな高度なネットワーク技術がこれらのデータセンターを接続し、AIトレーニングの効率を向上させます。