The Informationの報道によると、関係者によると、OpenAIは「GPT-Vision」というマルチモーダルAIシステムを発売する計画です。これは、Googleが最近企業向けテストで公開したマルチモーダル大規模モデル「Gemini」に対抗するものです。OpenAIは3月にGPT-4を発表した際にマルチモーダル機能をプレビューしていましたが、現在も一部企業のみに限定公開されています。それから6ヶ月後、OpenAIはGPT-Visionの幅広い展開の準備を進めています。この遅れの主な理由は、OpenAIが新機能の悪用を懸念しているためです。さらに、OpenAIは「Gobi」というコードネームの、より強力なマルチモーダルモデルの準備も進めています。OpenAIがマルチモーダルAIの商業化を積極的に推進していることは、マルチモーダルAIが実質的な応用段階に入ったことを示しています。業界関係者は、画像生成などの視覚能力がAIシステムの商業価値を高めると考えており、OpenAIのGPT-VisionはGoogleに対抗できる力があると見ています。AI分野の2大巨頭が競争することは、技術の進歩に役立つでしょう。