最近、OpenAIはChatGPTプラットフォームに新しい画像生成機能を追加し、多くのユーザーから注目を集めています。しかし、この人気機能はOpenAIに新たな課題をもたらしました。OpenAIの創設者Sam Altman氏は、需要の急増により、会社のGPU計算能力が限界に達していることを明らかにし、「GPUが煙を吐いている」と表現しました。そのため、画像生成機能の利用速度に制限を設ける必要に迫られています。

新しい機能「Images in ChatGPT」はGPT-4oモデルに基づいて開発されており、ユーザーは簡単な自然言語指示で画像を生成・編集し、複数回にわたって最適化できます。この機能の登場は、ChatGPTがテキスト、画像、コードなどマルチモーダルな能力を統合し、真の万能AIとなったことを示しています。ユーザーは簡単な指示を入力するだけで、普通の写真をジブリ風の芸術作品に変換できます。この手軽さが、急速な人気につながっています。

image.png

しかし、ユーザー数の急増に伴い、OpenAIは当初予定していた全ユーザーへの機能展開計画、特に無料ユーザーへの公開時期を遅らせる必要性を認識しました。Altman氏は、強力なGPUリソースを保有しているものの、これほどの大量の要求を処理するには力不足であると述べています。

画像生成プロセスでは、AIが画素単位で計算を行うため、膨大な計算リソースが必要です。GPU計算能力のボトルネックを解消するため、OpenAIは主に2つのアプローチを検討しています。1つはGPU性能の向上、もう1つはアルゴリズム最適化によるAIモデルの効率化です。後者では、アルゴリズムの改善により、同じ計算リソースでより多くのタスクを処理し、既存のリソースをより効率的に活用することを目指しています。

注目すべきは、OpenAIが保有するGPUリソースは業界トップクラスであり、主要投資家のMicrosoftが強力な支援を行い、大量のNVIDIA Hopperチップを購入することで、計算能力において競争優位性を確保していることです。それでも、AIアプリケーションの計算能力への需要は依然として高く、技術革新とリソース利用効率の向上を求める声が強まっています。

OpenAIはマルチモーダル技術の開発において、リソースと需要のバランスという課題に直面しています。