最近、OpenAIが提供する最新のテキストから画像生成モデルであるGPT Image2が権威ある評価で強力なパフォーマンスを発揮しました。SuperCLUEが公開した最新データによると、このモデルはグーグルのNano Banana2を正式に上回り、世界中のテキストから画像生成モデルの評価で覇者となりました。このモデルは4月21日にリリースされて以来、画質、理解力および細部の再現性において顕著な進化を遂げ、業界の技術基準を新たなレベルに引き上げています。

今回の評価で検証された多くの重要な側面において、GPT Image2の性能は非常に優れています。特に海外モデルにとって長年の課題であった漢字生成分野では、93.07点という高い得点を獲得し、文字の正確さは満点評価を受けました。このモデルは複雑な漢字を正確に認識・生成できることはもちろん、文字とアクリル、青花瓷などの異なる素材のテクスチャとの統合も可能であり、文字の浮遊感や乱読などの技術的な問題を効果的に解決しています。

1.png

また、テキスト処理能力の突破に加え、複雑なシナリオの再現においても非常に高い指示遵守度を示しています。生活感のある古いパン屋さんから、ダイナミックな非遺の鍛鉄花まで、GPT Image2は画面の細部を正確に捉えることができます。さらに、長いプロンプトや論理的推論が必要な場合でも、科学原理図や専門的なポスターなど、高難度のコンテンツを正確に出力でき、優れたテキストと画像の一貫性を示しています。

ただし、評価レポートでは、GPT Image2が空間関係の理解や深層知識の推論においてある程度の改善の余地があることも指摘されていますが、現実の再現や創作推論における優位性は、グーグルや百度などの競合他社との競争の中で際立っています。

業界の専門家は、GPT Image2の登場はOpenAIが視覚生成分野で再び先駆けたことを示すだけでなく、テキストから画像生成技術が単なるイメージ生成から高精度で論理重視のプロフェッショナルな応用段階へと進化していることを示唆しています。モデルの継続的な最適化により、AIによる視覚的創作の境界はさらに広がるでしょう。