告別 AI 標準臉：阿里發佈 Wan2.7-Image，開啓“千人千面”新時代

阿里大模型團隊今日正式發佈圖像生成與編輯統一模型 Wan2.7-Image。相比前代，該模型在人像定製化、色彩控制以及長文本渲染方面實現了質的飛躍，旨在打破 AI 生成圖像中常見的“千篇一律”感。

目前，該模型已在阿里雲百鍊平臺上線 API，並在萬相官網開放體驗。

核心升級:虛擬“捏臉”與精準調色盤

Wan2.7-Image 引入了多項行業領先的差異化功能，極大提升了創作的自由度:

千人千面: 強化了虛擬角色“捏臉”能力。用戶可以通過提示詞精準控制骨相、眼形（如杏仁眼、丹鳳眼）及五官細節，徹底告別標準化的 AI 臉。
精準調色盤: 全新支持色彩控制功能。用戶可以提取參考圖的顏色佔比，無論是梵高的明黃還是畢加索的冷藍，都能精準復刻到新生成的作品中。
3K Token 超長文本渲染: 解決了 AI 寫字的難題，支持多達12種語言，最高可渲染一頁 A4紙大小的複雜文字、表格或公式，且達到印刷級質量。

在圖像編輯領域，Wan2.7-Image 推出了“交互式編輯”功能。用戶只需通過精準框選，即可在指定區域實現元素的添加、對齊、移動甚至像素級的邏輯替換（例如:將冰塊替換爲水果，同時保持環境光影不變）。

此外，該模型支持多達12張的組圖生成，並能確保多主體（如合影、傢俱組合）在不同畫面中的風格與特徵高度統一。

阿里表示，Wan2.7-Image 採用了生成與理解統一的模型架構。通過在共享隱空間（Latent Space）實現語義映射，模型不再是盲目地猜測文字對應的像素，而是真正具備了底層語義認知。

在2026年的影像創作賽道上，Wan2.7-Image 的出現預示着 AI 繪畫正從“抽卡式”隨機生成進化爲“工業級”精密控制。無論是短劇分鏡、電商廣告還是社交變裝，這種高精度的編輯能力都將大幅降低專業內容的生產門檻。

谷歌發佈新Flow:集成 Nano Banana 模型並打通 Veo 視頻工作流

谷歌於2026年2月25日宣佈對其AI創意工作室Flow進行重大升級，核心是將圖像生成項目Whisk與ImageFX深度整合進平臺，推動多模態AI工具從分散實驗轉向統一工作流。新版Flow搭載最新的圖像模型Nano Banana，支持生成高精度圖像，並可直接作爲素材導入Veo視頻模型，實現從靜態圖像到動態內容的流暢創作。

生圖編輯合二爲一!Qwen-Image-2.0發佈:2K 極致質感挑戰視覺極限

阿里雲於2026年2月10日發佈新一代圖像生成基礎模型Qwen-Image-2.0，實現了圖像生成與編輯功能的融合。該模型採用7B輕量化架構，在保持高速推理的同時，具備四大核心優勢：專業的文字渲染能力，支持高達1k token的超長複雜指令處理，並在多項盲測基準中表現卓越。

告別 AI 標準臉：阿里發佈 Wan2.7-Image，開啓“千人千面”新時代

核心升級:虛擬“捏臉”與精準調色盤

相關推薦

xAI 發佈 Grok Imagine 質量模式 API：視覺生成邁入寫實新紀元

告別AI標準臉!阿里Wan2.7-Image發佈:能寫A4紙論文，還能像素級“捏臉”

Midjourney V8開啓測試:生成速度提升5倍並支持原生2K渲染

谷歌發佈新Flow:集成 Nano Banana 模型並打通 Veo 視頻工作流

生圖編輯合二爲一!Qwen-Image-2.0發佈:2K 極致質感挑戰視覺極限