本日、NVIDIA(エヌビディア)は、xAIと共同で開発したColossusスーパーコンピュータークラスタの正式稼働を発表しました。これは、世界最強のAIトレーニングクラスタであり、なんと10万個ものNVIDIA Hopper GPUで構成されています。

この巨大なシステムがこれほどの規模に達することができたのは、NVIDIA Spectrum-Xイーサネットネットワークプラットフォームのサポートのおかげです。このプラットフォームは、マルチテナント、超大規模なAIファクトリー向けに設計されており、標準イーサネットを介してリモートダイレクトメモリアクセスを実現し、卓越した性能を提供します。
Colossusは主に、xAIのGrokシリーズの大規模言語モデルのトレーニングに使用され、X Premiumユーザーへのチャットボットサービスも提供します。さらにエキサイティングなことに、xAIはColossusの規模を2倍に拡大し、20万個のNVIDIA Hopper GPUにする計画です。
NVIDIAの上級副社長であるGilad Shainer氏は、AIがあらゆる業界の重要なニーズとなっているため、パフォーマンス、セキュリティ、拡張性、コスト効率への要求がますます高まっていると述べています。Spectrum-Xプラットフォームの登場により、xAIのようなイノベーターは、より迅速なデータ処理、分析、実行能力を得ることができ、AIソリューションの開発、展開、市場投入時間を短縮できます。
イーロン・マスク氏もこれを称賛し、Colossusを世界最強のトレーニングシステムと呼び、xAIチーム、NVIDIA、そして多くのパートナーの努力を称賛しました。特筆すべきは、Colossusの構築が非常に効率的で、わずか122日で完了したことでしょう。通常、同規模のシステムは数ヶ月から数年かかる場合があります。最初のラックの設置からトレーニング開始までわずか19日でした。
このスーパーコンピューターのサポートにより、Spectrum-Xプラットフォームは最大400Gbpsの帯域幅を提供し、データ転送速度を大幅に向上させ、遅延を削減します。この機能は、迅速なデータ処理とリアルタイム分析を必要とする企業にとって非常に重要です。さらに、Spectrum-XはAIアプリケーション向けに最適化されており、データのルーティングと管理をよりスマートにすることで、システム全体の性能を向上させます。
Colossusアーキテクチャは、現代のアプリケーションが生成する膨大なデータに対応するために、効率的な拡張性を備えて設計されています。同時に、Spectrum-Xは持続可能性にも配慮し、高性能を維持しながらデータセンターのエネルギー消費量を削減し、組織のカーボンフットプリント削減に貢献します。
要点:
🌟 Colossusスーパーコンピューターは10万個のNVIDIA Hopper GPUで構成され、大規模言語モデルのトレーニングに使用されており、20万個のGPUへの拡張が計画されています。
⚡ Spectrum-Xネットワークプラットフォームは最大400Gbpsの帯域幅を提供し、データ転送とリアルタイム分析能力を最適化しています。
🌱 このプラットフォームは持続可能性に配慮し、高性能を維持しながらデータセンターのエネルギー消費量を削減することを目指しています。
