アマゾン・ウェブ・サービス(AWS)は、機械学習およびAIモデルのトレーニングと推論プラットフォームであるSageMakerを大幅にアップグレードしました。これはユーザー体験を向上させ、市場競争力を強化することを目的としています。このアップグレードでは、新しい監視機能、コード環境への接続、GPUクラスターのパフォーマンス管理などの新機能が追加されました。

SageMakerプラットフォームは2024年から、さまざまな機械学習ツールを統合した一元的なデータソースセンターに変貌しました。今回のアップデートの主な目的は、ユーザーがモデル性能の低下の原因をより明確に理解できるようにし、計算リソースの割当てをより多くの制御権で管理できるようにすることです。

AWS、アマゾン、クラウドサービス、Amazon、クラウドコンピューティング、サーバー

AWSのSageMaker総括Ankur Mehrotra氏は、『VentureBeat』とのインタビューで、多くの新機能の開発はユーザーからのフィードバックからインスピレーションを得たと語りました。彼は、生成AIモデルを開発する顧客がよく直面する問題として、問題が発生したときに具体的な問題の層を見つけるのが難しいことにあると述べました。

この問題を解決するために、SageMaker HyperPodの監視機能が導入され、エンジニアが計算層やネットワーク層など、さまざまな層の状態を確認できるようになりました。モデル性能が低下すると、システムは即座にアラートを発信し、ダッシュボード上に関連する指標を表示します。

監視機能に加え、SageMakerにはローカルの統合開発環境(IDE)への接続機能も追加されました。これにより、エンジニアはローカルで作成されたAIプロジェクトをプラットフォームにシームレスにデプロイできます。Mehrotra氏は、以前はローカルでコーディングされたモデルはローカルでのみ実行でき、拡張したい開発者にとって大きな課題だったと指摘しました。現在、AWSは安全なリモート実行機能を提供しており、ユーザーはローカルまたは管理されたIDEで開発し、SageMakerに接続して、さまざまなタスクに対応できるようになります。

AWSは2023年12月に、トレーニングモデルのサーバークラスターを管理するためのSageMaker HyperPodをリリースしました。HyperPodは需要パターンに応じてGPUの使用をスケジュールし、顧客がリソースとコストを効果的にバランスさせるのを助けます。AWSによると、多くの顧客は推論タスクにおいても類似のサービスを希望しています。推論タスクは通常昼間に実行され、トレーニングタスクはピークタイム以外に行われるので、この新機能は開発者にさらに柔軟性を提供します。

アマゾンは基礎モデルにおいてはグーグルやマイクロソフトほど注目されていないかもしれませんが、AWSは企業向けにAIモデル、アプリケーション、またはエージェントを構築するための堅牢なインフラストラクチャを提供することに取り組んでいます。SageMakerに加えて、AWSはBedrockプラットフォームをリリースし、アプリケーションやエージェントの構築のために設計されています。SageMakerの継続的なアップグレードにより、AWSは企業向けAI分野での競争力がさらに強化されています。

ポイント:

🌟 SageMakerプラットフォームの大規模アップグレードにより、可観測性とローカルIDE接続機能が追加されました。

⚙️ SageMaker HyperPod機能は、サーバークラスターをより良く管理し、リソースの利用率を向上させます。

🚀 AWSはAIインフラストラクチャ分野における展開により、市場での競争優位性を強化しています。