ネットイース互娱 AI Labの学術論文「General Image-to-Image Translation with One-Shot Image Guidance」が、国際的なコンピュータビジョン分野のトップ会議であるICCV2023に採択されました。
本論文では、VCTと呼ばれる画像編集手法を提案しています。
グーグルが新AIモデル「Nano Banana2Lite」を発表。激しい競争の中、単一画像生成時間を4秒未満に短縮し、低遅延とコスト効率で優位性を示す。....
xAIが「Grok Imagine API」の「品質モード」を開発者・企業向けに発表。視覚的リアリズム、文字レンダリング、クリエイティブ制御の3次元で革新を達成し、細部まで自然でリアルな画像生成を実現、描写力と表現力を大幅に向上。....
アリババがWan2.7-Imageモデルを発表。肖像画のカスタマイズ、カラーコントロール、長文レンダリングにおいて突破を遂げ、AIで生成される画像が一様になる問題を解決するためのものである。このモデルはすでにアリババクラウドの百煉プラットフォームのAPIに登場し、体験が公開されている。主なアップグレードには「仮想の顔の整形」と「正確なカラーパレット」機能があり、創作の自由度を大幅に向上させている。
Midjourney V8モデルのリリース。画像生成速度が5倍に向上し、2K解像度をサポート。画像の連続性を強化するパラメータが追加され、複雑なテキスト命令への対応能力が向上し、画像内テキストのレンダリング精度が最適化されました。
Googleは2026年2月25日、AIクリエイティブスタジオ「Flow」を大幅アップデートし、画像生成プロジェクト「Whisk」と「ImageFX」を統合。多モーダルAIツールを統一ワークフロー化。新モデル「Nano Banana」で高精度画像生成を実現し、Veo動画モデルへのシームレスな連携も可能に。....