商湯科技は最近、デザインのシーン向けに開発中のマルチモーダル大規模モデル「U1Pro」を秘匿して研究している。このモデルは、商湯の「日日新(リュウリュウシン)」モデルシリーズの新しいメンバーで、商湯の共同創設者で首席科学者である林達華が主導しており、OpenAIのGPT-Image2と対等になることを目指し、長距離論理能力を持ち、思考する画像生成モデルを開発することを目的としている。噂では、「U1Pro」は今年7月に内部招待テストを開始し、その後顧客にサービスを提供する予定である。

テキストから画像への生成分野において、OpenAIのGPT-Image2は画像品質、文字レンダリングおよび指示遵守において優れているため、LMSYS Chatbot ArenaのスコアでグーグルのNano Banana2を大幅に上回り、デザイン業界から広く注目されている。商湯が今回発表した「U1Pro」はこの核心的な市場に直接対抗するものである。関係者によると、このモデルは複雑なデザイン要件に対して「デザイン—生成—評価」の長期的なループを実現でき、最大8K解像度の超高精細出力をサポートしている。多数の内部評価では、同じプロンプト条件下で「U1Pro」の生成結果はGPT-Image2に非常に近づいており、一部の側面では優位性を示している。