當AI圖像生成進入“專業級”賽道,Adobe正以一場全方位升級,重新定義創意工作流。10月29日,Adobe正式發佈其最新一代圖像生成模型——Firefly Image5,並同步推出多項突破性功能:原生400萬像素輸出、分層式提示編輯、自定義藝術風格模型、AI語音與配樂生成,全面打通圖像、視頻、音頻的AI創作閉環。

image.png

Image5:從“夠用”到“專業級”的質變

相比前代僅支持100萬像素原生生成(需後期放大至400萬像素),Firefly Image5可直接生成高達400萬像素(約2240×1792)的高質量圖像,細節銳度與色彩表現顯著提升。尤其在人物渲染方面,Adobe優化了面部結構、肢體比例與光影邏輯,大幅減少“AI畸形手”等常見問題,更貼近專業插畫與商業攝影標準。

更革命性的是其分層式編輯能力:模型將圖像中的不同對象自動識別爲獨立圖層,用戶可通過自然語言指令(如“把帽子換成紅色”“放大背景建築”)或傳統工具(旋轉、縮放)精準調整單一元素,而系統會智能保持整體畫面的光影一致性與細節完整性,真正實現“所想即所得”的非破壞性編輯。

image.png

創作者專屬AI:一鍵訓練個人風格模型

爲滿足專業藝術家對風格一致性的高要求,Adobe推出自定義模型功能(Closed Beta)。用戶只需拖拽自己的插畫、照片或手稿,系統即可基於這些資產訓練專屬圖像生成模型,確保輸出內容完全契合個人藝術語言。這一能力將極大提升品牌視覺、角色設計、IP衍生等場景的工作效率,讓AI真正成爲“數字學徒”。

多模態創作平臺:圖像+視頻+音頻一體化

新版Firefly網站已重構爲多模態創作中樞:

統一提示框支持在圖像與視頻生成間無縫切換;

模型選擇器集成Adobe自研模型及OpenAI、Google、Runway、Topaz、Flux等第三方引擎;

首頁聚合個人文件、歷史生成記錄及Creative Cloud應用快捷入口;

視頻工具新增時間軸與分層編輯(Private Beta),邁向專業級AI視頻工作流。

音頻方面,Firefly現支持通過AI提示生成完整配樂與語音旁白,底層採用ElevenLabs語音模型,並引入“詞雲式提示”功能——用戶點擊關鍵詞即可快速構建複雜指令,降低創作門檻。

image.png

瞄準“下一代創作者”:打破傳統工作流束縛

Adobe生成式AI副總裁Alexandru Costin表示,Firefly的目標用戶是“GenAI原生創作者”——他們不拘泥於傳統軟件邏輯,更願將AI深度融入全流程。正因如此,Firefly得以擺脫Photoshop等經典工具的交互慣性,大膽重構界面與功能,打造更符合AI時代直覺的創作體驗。

在Canva等競品加速AI化的背景下,Adobe正以專業級質量+開放生態+全棧能力構築護城河。Firefly Image5不僅是一次模型升級,更是Adobe向“AI原生創意操作系統”邁出的關鍵一步——在這裏,創意不再受限於技術,而是由想象力直接驅動。