OpenAI は新世代の画像生成モデル GPT Image1.5 をリリースし、グーグルが人工知能分野で急成長していることに対抗しています。AIbase の報道によると、この新しいモデルは性能向上を約束しており、より正確な指示の理解、より詳細な編集コントロール、そして最大4倍の高速な画像生成が特徴です。

 速度と精度のアップグレード: GPT Image1.5がグーグルに挑む

GPT Image1.5は今週火曜日からすべてのChatGPTユーザーおよびAPIユーザーに公開されています。今回のアップデートは、OpenAI社長のSam Altmanが「赤色警戒」状態に入った直後に、人工知能分野でのリーダーシップを取り戻すための最新の戦略的行動です。

以前には、グーグルが発表したエクスプレスモデル Gemini3 およびそのウイルス的な画像生成器 Nano Banana Pro が強く出たことで、LMArenaランキング上位にランクインし、市場シェアを侵食し始めました。OpenAIは先週、「これまでで最も進んだ」と述べたモデル GPT-5.2 をリリースしましたが、それでもグーグルがリードを維持しています。据えよると、OpenAIは1月初頭に新たな画像生成器をリリースする予定でしたが、競争への対応として、このリリース計画は早められました

QQ20251217-084853.png

 後処理に匹敵する: GenAI画像の一貫性の問題解決

GPT Image1.5は4月にリリースされたGPT Imageの次世代バージョンであり、画像生成器をプロトタイプ段階から生産性の高い機能へと進化させています。新モデルは特に後処理機能に注目されており、Nano Banana Proと同様に、編集中に重要な視覚的一貫性(顔の類似度、照明、構図、トーンなど)を保持できるようにします。

これはGenAI画像ツールにとって大きな進歩です。OpenAIは特に、現行のツールがイテレーション編集において不十分であることを指摘しています。例えば、「顔の表情を調整」や「光をもっと冷たくする」などの指示では、モデルが画像全体を再解釈してしまい、結果が一貫しないことがあります。GPT Image1.5はこの指示の理解の課題を解決することを目指しています。

 「クリエイティブスタジオ」の統合と視覚体験の最適化

OpenAIアプリのCEOであるFidji Simoはブログ記事で、ChatGPTはサイドバーを通じて、「よりクリエイティブスタジオのような」専用のアクセスポイントを提供していると明らかにしました。新しい画像表示および編集インターフェースは、ユーザーが自分の考えに合った画像を作成したり、人気のあるヒントやプリセットフィルターからインスピレーションを得たりしやすくするために設計されています。

新たな画像生成器に加えて、OpenAIはChatGPTの全体的な使い勝手を改善するために、より多くの視覚要素を導入する予定です。Simoは、「将来的には検索クエリに明確なソースを持つ視覚要素が表示されるようになる」と語っています。これは単位換算やスポーツスコアを確認するなどのタスクに非常に役立ちます。