正文

Hugging Face推出aMUSEd模型，幾秒鐘內生成圖像

發布於AI新閒資訊

時間 :Jan 5, 2024

閱讀 :1分鐘

Hugging Face推出的aMUSEd模型可以在幾秒鐘內生成圖像，採用了輕量級的文本到圖像模型，使用Masked Image Model（MIM）架構，大大減少了推理步驟，提高了生成速度和可解釋性。aMUSEd模型可在Hugging Face上的演示中進行嘗試，目前以研究預覽版形式提供，使用OpenRAIL許可證，鼓勵社區進一步探索非擴散框架用於圖像生成。

圖像生成再提速：谷歌發佈 Nano Banana 2 Lite 模型，極致性價比挑戰行業門檻

谷歌推出新AI模型Nano Banana2Lite，在激烈競爭中凸顯速度與成本優勢。其核心升級在於將單圖生成時間壓縮至4秒內，大幅降低延遲，同時優化使用成本。

Jul 1, 2026

212.6k

xAI 發佈 Grok Imagine 質量模式 API：視覺生成邁入寫實新紀元

xAI 推出 Grok Imagine API 的“質量模式”，面向開發者與企業。該模式在視覺寫實、文字渲染和創意控制三大核心維度實現突破，能生成細節豐富、自然逼真的圖像，顯著提升畫面細膩度與表現力。

May 7, 2026

292.3k

告別 AI 標準臉：阿里發佈 Wan2.7-Image，開啓“千人千面”新時代

阿里發佈Wan2.7-Image模型，在人像定製、色彩控制和長文本渲染方面實現突破，旨在解決AI生成圖像“千篇一律”的問題。模型已上線阿里雲百鍊平臺API並開放體驗，核心升級包括虛擬“捏臉”和精準調色盤功能，顯著提升創作自由度。

Apr 1, 2026

309.1k

Midjourney V8開啓測試:生成速度提升5倍並支持原生2K渲染

Midjourney V8模型發佈，圖像生成速度提升5倍，支持2K分辨率，新增增強圖像連貫性參數，提升對複雜文本指令的遵循能力，優化圖像內嵌文本渲染準確率。

Mar 19, 2026

223.0k

谷歌發佈新Flow:集成 Nano Banana 模型並打通 Veo 視頻工作流

谷歌於2026年2月25日宣佈對其AI創意工作室Flow進行重大升級，核心是將圖像生成項目Whisk與ImageFX深度整合進平臺，推動多模態AI工具從分散實驗轉向統一工作流。新版Flow搭載最新的圖像模型Nano Banana，支持生成高精度圖像，並可直接作爲素材導入Veo視頻模型，實現從靜態圖像到動態內容的流暢創作。

Feb 26, 2026

226.8k

智啟未來，您的人工智能解決方案智庫