グーグルは新世代の画像生成モデル「Nano Banana2」を正式にリリースしました。このモデルはGemini3.1Flash Imageアーキテクチャに基づいて構築されており、前バージョンと比較して理解力や応答速度において顕著な向上を遂げただけでなく、ユーザーからのフィードバックに基づいた深い最適化も行われています。
これまでAIによる画像生成で一般的に見られていた問題点に対して、Nano Banana2は特に中国語文字コードの乱れ、意味表現の混乱、および画像の偽像などの問題を重点的に修正しています。公式が公開した比較画像によると、新しいモデルは明確で正確な中国語のテキストを生成できるようになっており、中国語の文脈でのクリエイティブな利用可能性が大幅に向上しています。

性能パラメータにおいて、Nano Banana2は全面的なアップグレードを実現しました:
画質の飛躍:出力解像度は2Kから4Kへと引き上げられ、細部の表現力がより強くなりました。
一貫性の強化:複数の生成された画像において最大5つのキャラクターイメージの一貫性をサポートします。
複雑なシーン処理:一枚の画像内に最大14の異なるデザイン要素を正確に統合できます。
現在、グーグルはこのモデルを段階的にGemini、検索エンジン、Google AI Studio、そしてAIクリエイティブツールのGoogle Flowに統合する予定です。また、有料APIサービスおよびGoogle Adsも順次モデルの更新を行います。
