ネットイース互娱 AI Labの学術論文「General Image-to-Image Translation with One-Shot Image Guidance」が、国際的なコンピュータビジョン分野のトップ会議であるICCV2023に採択されました。
本論文では、VCTと呼ばれる画像編集手法を提案しています。
アリババがWan2.7-Imageモデルを発表。肖像画のカスタマイズ、カラーコントロール、長文レンダリングにおいて突破を遂げ、AIで生成される画像が一様になる問題を解決するためのものである。このモデルはすでにアリババクラウドの百煉プラットフォームのAPIに登場し、体験が公開されている。主なアップグレードには「仮想の顔の整形」と「正確なカラーパレット」機能があり、創作の自由度を大幅に向上させている。
Midjourney V8モデルのリリース。画像生成速度が5倍に向上し、2K解像度をサポート。画像の連続性を強化するパラメータが追加され、複雑なテキスト命令への対応能力が向上し、画像内テキストのレンダリング精度が最適化されました。
Googleは2026年2月25日、AIクリエイティブスタジオ「Flow」を大幅アップデートし、画像生成プロジェクト「Whisk」と「ImageFX」を統合。多モーダルAIツールを統一ワークフロー化。新モデル「Nano Banana」で高精度画像生成を実現し、Veo動画モデルへのシームレスな連携も可能に。....
アリババクラウドは、2026年2月10日に新世代の画像生成基盤モデル「Qwen-Image-2.0」をリリースしました。このモデルでは画像生成と編集機能が統合されています。7Bの軽量アーキテクチャを採用しており、高速な推論を維持しつつ、4つの主な強みを持っています。専門的なテキストレンダリング能力、最大で1,000トークンの超長かつ複雑な指示処理への対応、そして多数の盲測基準において優れたパフォーマンスを発揮しています。
XプラットフォームはAIモデルGrokの画像機能に対して厳格な制限を実施し、現実的人物の写真の編集を禁止しており、特に露出した姿に変更することを厳しく禁止している。これは最近の「児童の性的化」に関連する画像に関する指摘への対応である。