近日,阿里媽媽創意團隊發佈了 FLUX.1-Turbo-Alpha,這是基於 FLUX.1-dev 模型訓練的一款8步蒸餾 Lora 模型。

該模型採用了多頭判別器,顯著提高了蒸餾的質量,支持文本到圖像生成、修復控制網等多種 FLUX 相關的應用。團隊建議在使用時將引導尺度設置爲3.5,Lora 尺度爲1,未來還會推出更低步數的版本。

image.png

FLUX.1-Turbo-Alpha 可以直接與 Diffusers 框架結合使用。用戶只需通過幾行代碼便能加載模型並生成所需的圖像。例如,你可以創建一個有趣的場景:一隻微笑的樹懶穿着皮夾克、牛仔帽、格子裙和蝴蝶結,站在一輛畫有城市風景的光滑大衆麪包車前。只需簡單調整參數,就能在1024x1024的分辨率下生成高質量的圖像。

image.png

此外,該模型也兼容 ComfyUI,可以用於文本到圖像的快速工作流程,或在修復控制網中實現更高效的生成效果。通過這種技術,生成的圖像能夠很好地跟隨原始輸出,提升用戶的創作體驗。

FLUX.1-Turbo-Alpha 的訓練過程同樣令人矚目。該模型在超過100萬幅開源和內部資源的圖像上進行訓練,具備6.3以上的美學評分,且分辨率均高於800。團隊在訓練過程中採用了對抗訓練的方法,以提升圖像質量,並針對每個變換器層增加了多頭的設計。訓練過程中的引導尺度固定爲3.5,時間偏移則設爲3,使用了混合精度 bf16,並設定學習率爲2e-5,批量大小爲64,圖像尺寸爲1024x1024。

FLUX.1-Turbo-Alpha 的推出,標誌着阿里媽媽在圖像生成領域的又一次突破,推動了人工智能技術的普及與應用。

項目入口:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha

劃重點:

🌟 這款模型基於 FLUX.1-dev,採用8步蒸餾和多頭判別器,提升圖像生成質量。  

🖼️ 支持文本到圖像生成及修復控制網,用戶可輕鬆創建多種有趣場景。  

📊 訓練過程採用對抗訓練,訓練數據超過100萬張圖像,確保模型高質量輸出。