Midjourney V8開啓測試:生成速度提升5倍並支持原生2K渲染

3月18日，Midjourney正式發佈其V8模型的早期版本。作爲一次重大的架構更新，V8模型在Alpha網站上線後立即引發行業關注，其圖像生成速度較前代提升約5倍。

此次更新引入了原生渲染2K分辨率圖像的--hd模式，並新增旨在增強圖像連貫性的--q4參數。技術層面，V8顯著提升了對複雜、長文本指令的遵循能力，尤其在處理圖像內嵌文本渲染時，通過引號識別機制實現了更高的準確率。

儘管性能大幅躍升，但Midjourney仍堅持1000%的純擴散模型路徑。在與谷歌Nano Banana及OpenAI GPT Image1.5等融入自迴歸（AR）組件的混合架構模型對比中，V8在處理極高邏輯要求的抽象指令(如特定角色位置顛倒)時仍存在侷限。

爲此，官方建議追求極致寫實的用戶配合--raw模式或風格參考功能使用。值得注意的是，性能的提升伴隨着成本轉嫁:在運行高清及高連貫性模式時，單次作業耗時與費用均達到標準模式的4倍，且首發階段暫不支持非耗時的“放鬆模式”。

在當前AI繪畫領域加速邁向自迴歸與擴散模型融合的背景下，Midjourney V8的發佈標誌着擴散模型在效率極限上的進一步突破。然而，高昂的算力溢價與複雜邏輯理解的瓶頸，也反映出純擴散架構在面對日益增長的精確控制需求時所面臨的挑戰。

前迪士尼工程師聯手Midjourney 要打造會“呼吸”的仿生機器人

Animotion Robotics創始人朱聖傑與Midjourney聯合創始人John Jiang共同推出首款DIY仿生機器人Éloi，旨在突破具身智能極限，重塑人機情感共生。朱聖傑曾任職迪士尼Imagineering機器人工程師，團隊背景硬核，融合“迪士尼基因”與AI芯片技術，探索物理世界人機交互新可能。

告別 AI 標準臉：阿里發佈 Wan2.7-Image，開啓“千人千面”新時代

阿里發佈Wan2.7-Image模型，在人像定製、色彩控制和長文本渲染方面實現突破，旨在解決AI生成圖像“千篇一律”的問題。模型已上線阿里雲百鍊平臺API並開放體驗，核心升級包括虛擬“捏臉”和精準調色盤功能，顯著提升創作自由度。

谷歌發佈新Flow:集成 Nano Banana 模型並打通 Veo 視頻工作流

谷歌於2026年2月25日宣佈對其AI創意工作室Flow進行重大升級，核心是將圖像生成項目Whisk與ImageFX深度整合進平臺，推動多模態AI工具從分散實驗轉向統一工作流。新版Flow搭載最新的圖像模型Nano Banana，支持生成高精度圖像，並可直接作爲素材導入Veo視頻模型，實現從靜態圖像到動態內容的流暢創作。

生圖編輯合二爲一!Qwen-Image-2.0發佈:2K 極致質感挑戰視覺極限

阿里雲於2026年2月10日發佈新一代圖像生成基礎模型Qwen-Image-2.0，實現了圖像生成與編輯功能的融合。該模型採用7B輕量化架構，在保持高速推理的同時，具備四大核心優勢：專業的文字渲染能力，支持高達1k token的超長複雜指令處理，並在多項盲測基準中表現卓越。

Midjourney V8開啓測試:生成速度提升5倍並支持原生2K渲染

相關推薦

前迪士尼工程師聯手Midjourney 要打造會“呼吸”的仿生機器人

告別 AI 標準臉：阿里發佈 Wan2.7-Image，開啓“千人千面”新時代

“DeepMind 之父”哈薩比斯：超級 AI 或導致人類滅絕，且競賽已無法停止

谷歌發佈新Flow:集成 Nano Banana 模型並打通 Veo 視頻工作流

生圖編輯合二爲一!Qwen-Image-2.0發佈:2K 極致質感挑戰視覺極限